どらちゃんのポッケ

R・統計・技術メモなど勉強ログ置き場

「原因と結果」の経済学 ―データから真実を見抜く思考法を読んだ。データと向き合う考え方を教えてもらえる気がする良書。

なぜこの本を手に取ったのか?

2−3年前から因果推論が流行の兆しを見せていて、ずーっと勉強しようとは思っていたが、踏み出せずにいたところに、岩波データサイエンス Vol.3(特集:因果推論)が発売され、因果推論ってこんな感じなんだーと思ったところに、この本が発売されたので読むしかないでしょと。

どんな本だったのか?

今年読んだ本の中で、ベスト5には入るすごく良い本だった。

ランダム化比較試験、差の差分析、回帰不連続デザイン、プロペンシティ・スコア・マッチング(傾向スコア)、回帰分析などなど・・・。因果分析のやり方の概念を具体例を交えながら、分かりやすく説明していた本だった。

概念・考え方に限定し、数式やコードなどは出てこないので、この本だけでは実際に因果統計分析をやろうと思ってもすぐに実践することはできない。けれど、考え方を知っているだけで、誤った解釈を防げたり、データ集めの方針を決めたりする時に参考になる。「入門の入門」にはもってこいだと思う。

因果推論は、 社会心理学会 第3回春の方法論セミナーに参加したり、岩波データサイエンス Vol.3(特集:因果推論)を読んだぐらいで、まだ全然勉強できていないが、俯瞰して分析方法や概念を知れたのは、とてもよかった。

雑多な感想

  • 「おぉ、こんな感じでデータを扱えば因果の方向の考察ができるのか?」という感覚は、大学時代に初めて実験計画法を教わったときのような感覚だった。

  • 現在のビッグデータ時代、データが手に入れやすくなって、データドリブンな判断がされているが・・・。得られた結果は、相関なのか?因果なのか?因果の方向はどっち向きなのか?はたまた、偶然なのか?このあたりのデータを解釈する上でのデータリテラシーは、データに携わる人々は皆が抑えておくべき必須知識だと思う。

  • 因果推論と言っても、唯一無二の方法があるというわけでなく、得られるデータや使い方によって色々な方法を使いこなさないといけない。それぞれの分析方法の前提条件や分析方法のエビデンスの高さなど、分析手法間の違いも、なんとく把握できた。岩波データサイエンス Vol.3(特集:因果推論)を読んだ時には、そこまで理解できていなかったので、とても助かった。

  • 空前のDeepLearningブーム・機械学習ブームの中、「データを大量に集めてDNNにかけたら、なんか知らないけど予測が高精度に出来て良かった!」というのも一つの解としてはアリだとは思う。けれど、統計モデリング派の私としては、その裏側の仕組みやモデリングを行って人間が理解できるようにするという思想は大事にしたいなと思っていて、そういう意味でも因果推論の話は学んでいきたいと思う。そして、最近、機械学習界隈でのDeepLearningに相当するものは、統計モデリング界隈では、因果推論かベイスモデリングMCMCとか)であって、この2つはブームが来程るのではないかと個人的には思っている。

イマイチまだわかっていないこと

教えていただきたい・・・。

  • SEM(構造方程式モデリング)との関係

    • SEMも中途半端な理解しか出来ていないけれども、因果推論の文脈でSEMをどう捉えればいいのかが、ピンとこない。
    • SEMも因子分析+回帰分析なので、やってることは、回帰分析の因果推論と同じ??
  • GoogleCausalImpactというRのパッケージは、因果推論の文脈でいうと何をしているのか?

    • 時系列データから、反事実を推定して穴埋めし、それと実際のデータを比較しているという理解でいいのだろうか・・・。

次は・・・?

この本の著者の津川先生が↓ とおっしゃっているので、

データ分析の力 因果関係に迫る思考法を読もうかと思います