「データ分析の力 因果関係に迫る思考法」を読む。
「統計学が最強の学問である」に引き続き、統計学入門的な本を読んでみた。この著者も30代と若い。本書では特に相関関係と因果関係の違いに焦点を当て、実際の実験やまたは自然実験というデータの検証方法によって、社会をどのように統計的に有意な意味づけをすることが出来るかという思考を鍛えることが出来る。「近年の経済学では、経済理論の研究と共に「理論的予測が本当に現実社会で起こっているのか、データを使って分析する」という「経済学の実証分析」」らしい。本書も新書らしく簡潔で数式を使わずに丁寧に解説しており、かつ次の読書に繋がるような読書案内や実証データへのアクセスも用意しており、非常にリーダブルでためになった。
「統計学が最強の学問である」でも学んだ、ABテストが実施できない時に行う自然実験の考え方は面白かった。「世の中に存在する「境界線」を上手く使うと、誰も実験したわけではないのに「あたかも実験が起こったような状態」を考えることができる」という。このやり方として、RDデザインという手法や集積分析という報酬や支払いが「階段状に変化する」事象をうまく捉える手法を紹介してくれる。これにより、燃費向上政策のための階段状の制限が、メーカーに車重量を挙げるインセンティブを作ってしまい、結果的に燃費を下げてしまう結果となったという。しかも、車重量の増加によって事故時の死亡率を高めてしまい、年間1000億ほどの社会損失になっていたらしい。きちんと分析しないとこういうことが分からないというのが怖い。ちなみに、本書でオバマは自身の選挙時にAB分析を取り入れてより確実な有権者への支援体制を作ったらしい。さすが。
また、パネルデータという分析手法の紹介もあり、これは「2つのグループの片方に介入し、片方に介入が起こらなかった場合のデータを時間を追って分析することによってどのような差が生じするかを分析する」ようなものらしい。この分析には「2つのグループが並行トレンド」という状態になっているかが重要で、介入以外の諸条件をなるべく揃えることによって得られる状態のこと。
また、価格戦略についての検証もされていて、実態は同じなのに税抜き表示と税込み表示で売り上げが有意な差が出てしまったらしい。消費者というか人間の行動がいかに非合理的かってことだよね。
また、上記の分析の弱点として分析者が踏まえておくべきこととして、分析したことが他の領域でも同じことが言えるかという「外的妥当性」の話も面白かった。ある特定の領域で有意な差が認められても(内的妥当性)、他の領域でうまく差が出るとも限らないという。アメリカでうまく行った政策が日本でうまくいくかは別、みたいな。