MITのMicro MasterのData Analytics for Social Scientistsを受けてみた

Data Analytics for Social Scientists(以下DASS)はDEDPに入るための必修の一つで、データ分析についてと機械学習のさわりを学ぶ講座です。

MITのMicro MasterとDEDPのご紹介の続きです。これを見てこれからこの講座を受ける方の参考になればと思います。

講座のフレームワーク

費用は$1000ですが、年収証明をすると$200まで下がります。私は$10000で受けましたがけどね。コース支払いがあってから、支払いをうけつけるまでしばらく時間がかかりました。心配しなくても支払ってればちゃんと受け付けてくれます。

講義は9月から始まり12月末で終わる3ヶ月。

毎週

  1. 動画の講座
  2. Finger quizという動画の内容を確認する問題
  3. ホームワーク

があります。

動画は5分−10分程度。授業を録画したものですがスライドは別撮りで鮮明に写っています。またスライド内容はダウンロードできるので決して見えないことはありません。さらにコース内では字幕が入っていますので、早口だったり分からない言葉があっても字幕を見て追いかけることができます。

実はこの講座クリックするとYoutubeに限定高秋されている講座なんですよね。でも公開はやめておきます。この講座の紹介動画共有しておきますね。

動画の長さは5分−10分程度。

Finger Testは1−5問ぐらいで、動画の直後にあります。選択肢や数字の入力で、その動画をちゃんと読んでいれば答えられる問題です。でも、回答の回数に制限があって、2回だったり1回だったりします。そして、このFinger Testの成績も全体の評価に反映されます。

そして週ごとにHW(Home Work)があります。これは15-20問ぐらいの問題で、これはこれで全体の評価に反映されます。

1週間にだいたい20本ー40本に細切れにされた60-120分の動画を見て、30問ー50問ぐらいのFinger Testを解いて、15-20問ぐらいのHWを納期までに終わらせることが求められます。これが3ヶ月間で10コマぐらいあります。

そして、全部の講座が終わると、Final Testという、一発勝負(1回しか答えられない)試験があり、全体から問題が出ます。

それが終わるとProtocol Testという75分の時間制限がある試験を受けます。これが実は50%ぐらいの評価を決めるんですよね・・・
この試験はオンラインですが、テキストなど持ち込み不可。A4の紙2枚と1台のパソコンしか使ってはいけません。パソコンから監視がある状態で受けます。

このProtected Testは試験前に専用の監視ソフトをPCにインストール、試験前に部屋の周囲をカメラで確認することが求められます。そして試験中はずっと録画してて誰も入ってきてはいけない部屋が求められます。とはいえ、私の部屋でも通ったので、部屋日本店があるとかそういうことは問題じゃなさそうでした。もちろん試験中に本とかみてたらアウトでしょうけどね。
なお、試験は電卓不可で試験サイトの電卓しか使えません。試験にはそんな複雑な計算は出ません。だからもちろんRをつかうような試験もありません。数式は基本的な分布の種類ごとの数式は知っておいた方がいいですね。あとRの出力に対し、どう回帰式を当てはめるかとか、何を見て精度を確認するかとかは知らないと難しいと思います。

わかります?やべーぐらいしんどかったです(笑)

カリキュラム概要

多分、確率統計ぜーんぶ中学から大学まで3ヶ月で学ばせるものです。だいたいの意訳ですが、こんなことやりました。

  1. Rの基礎、自習方法(swirl などを使う)
    Rstudioなど入れます
  2. 確率基礎、確率変数、分布
    2C4とかやりますね
  3. 確率変数と条件付き分布などとRでの解析
  4. 確率変数の期待値、分布、回帰などの説明とRでの解析
  5. 中央極限定理とRでの解析
  6. 推定量、信頼区間など
  7. 因果関係、無作為実験、ノンパラメトリック比較と回帰をR使って説明
  8. リニアモデルと多変量線形モデルをRで解析
  9. 回帰の実行と省略された変数のバイアスについてRでシミュレーション
  10. 内生性と操作変数と実験計画をRを使いながら紹介とビジュアライゼーションの方法
  11. 機械学習1、機械学習2
    これはほんと触りだったと思う

微分、行列など高校数学レベルは必要。たまに偏微分とか逆行列とか出てきてやべー分からんとなったけど、その理解はこの講座をパスするにあたっては、そんな大事ではないですね。

そうそう、レビュー動画を見つけたんですよ。この動画見てたら、講師がすごい人だったと知ったんです。アウトラインを知るにはこれがいいかも。

しんどかった理由

1週間12時間ー14時間というのはネイティブで数学とR触ってる人向けの時間で、2倍−3倍かかってた思います。

  1. 内容てんこ盛りすぎ
    動画の量も多いけど、理解しなければいけない内容も多くて私だけではなく、他の受講生からも悲鳴が上がってました。
    最初は高校受験のYoutube、後半は大学生向けYoutubeを見て日本語での復習予習は欠かせませんでした
  2. 英語で数学とRをやるハードル
    英語リスニングで一杯一杯なのに、数式が入ってきます。英語の中に微分積分行列とかの記号見ると、本能的には吐き気を催します(笑)。DerivativeとかIntegralとか慣れる必要があります。そして、どれもそんなお子様レベルではなく、がっつりハイレベルなものをやります。実際のデータを使ったりするんですよね。私は初歩的な教育系Youtubeを見てなんとかしました
  3. 内容がどんどん進んでく
    MITレベルの授業なんで、基礎理解とか一瞬でわかってあたりまえって感じで進んで行きます。かなり数式も説明もすっとばすので日本人の優秀な予備校の先生や大学のYoutubeに助けてもらいました。チューターも「これはわかりにくいから」とサポート掲示板で頻繁に捕捉説明をいれていました

おかげさまで最初は具合悪くなってしまいました。
飛び交う英語と数式とR言語でストレス発散と脳の疲労回復に深夜まで学習し、甘いものが手放せなくなり、アトピーも悪化しました(笑)
最初手帳をノートにしてたら一瞬で1冊なくなってしまい、慌てて大学ノートに手書きでノート作りました。手帳2冊大学ノート3冊になりました。数式があるのでデジタルで書くのが大変すぎたので手書きになりました。

ウェブサイトとYoutubeには助けられました。
統計学の時間はよく読んでましたし、Youtubeでも大学受験対策用の動画とか、理系大学生向けの予備校風の講座とかはよく見ました。

こういう情報が動画になってるのは本当に助かる。ありがたい。

しかし価値がある講座だった

もうへとへとになりながらこなしました。しかもフランスに講義を受けている途中で10日間いくので、その分余裕を作らなければなりません。フランスへの旅程はずーっとHWを解いていました(笑)

みんなどうやって勉強してるのかな?と思い調べてみたら、何人か受けた先輩がいらっしゃいました私と同じところを目指す方もいるようです。でもみなさん若いですよねー50近いおじいさんはいなそう。

そして、記事がどこにあるか忘れてしまったが、MicroMasterコースの講師にノーベル賞受賞者が含まれてることを知りました。2人いて年配の方の方かと思ったら若いDuflo先生の方だった(2019年経済学のノーベル賞受賞)。ノーベル賞受賞者から教えてもらうことなってそうそうない・・・中学レベルから教えてもらえるなんてありがたいこと・・・だと思いませんか?

そして、私みたいな人でも、1週間でちゃんと課題を解けば理解できるってすごいことなんじゃないかと思いはじめました。これはかなり効果の高いオンライン学習なのではないかと。5分なら我慢して動画もみてられる。Finger Testがあるから抜けずにちゃんと理解しようとする。そしてHMでいい点取ろうとすればその週復習もする。ノートも取る。そうそれこそ学びなんですよ。

私たちの周りにデータサイエンス的な授業があるけど、みんなそこまでストイックなことを求められないでしょ?社会人向けで忙しいしお金はあるから、もっとゆるいと思うのです。しかしMITのこのコースは容赦ない。納期も決まってて、理解も求めるんです・・・ということは理解できるようになるということでもあるんですよね。

英語であることは振り返ると良かったことで、どうせ英語で学んだり話したり書いたりするわけだし、英語だから理解できていないこと逃げられないんですよね。追い詰めてでもやらなきゃいけなくなる、それが大事で、私にとって役に立ちました。

でもね、最後のFinal Testはやり直しゆるされない一発勝負のテスト。そしてProtected Examはカンペも持ち込みも不可の75分のテスト。正直Protected Examは落ちたと思いました。後半の文章問題(多変量解析でデータをもとに内生性などを見つける問題)がダメダメでした。だってそのときでた単語がわからなくて・・・丁寧に表を読みたいけど、もう何書いてあるか読むにも時間が足りなすぎ。もうボロボロでした。そして中学レベルの確率も間違ってて・・・

考えてみたら、人生で最初の数学の英語のテストがMITの修士なんて、ペーパードライバーがF1レースに出るようなことやってしまったのだな・・・ととても後悔しました。

「Passed」とコースに表示されたとき、それは本当に受かったのかな?としばらく信じられませんっでした。妻に見せたら「Passedは受かってるって意味じゃないの?」と言われ、やっとその気になって他の人に知らせたら「そりゃ受かってるでしょ!おめでとう!」ということになりました。

結局スレスレで受かりましたが、大きな自信になりました。

でもこれはゴールじゃなくスタートで学んだ技術を実務で活かしたい。2023年はウェブ解析のレポートを頑張る年にしようと思います。そう言ってるそばから、ちらっと見たDiDとかCausual Effectとかなんだっけともう一度ノート見ないと忘却してしまう始末。もう年だし、使わないで覚えてられるような能力ないから使わないと。

Toshiaki Ejiri: Born in Fukushima, working as web analytics consultant since 2000.