2013.03.24

▽社会調査法vs疫学・生物統計学――『統計学が最強の学問である』

西内啓『統計学が最強の学問である』(ダイヤモンド社)

やや、煽り気味のタイトルなので、お手軽なハウツー本のような印象を持つが、内容はいたってまじめで、統計学の基本事項を学ぶことができる。

本書の主眼は、統計の技術的な手法を伝授するためのものではなく、統計学の歴史的な成り立ちや、さまざまな統計手法の解説を行う点にある。

とくに、統計的手法を使うさまざまな学問において、その使い方の違いが原因となる対立も生じているという。

《疫学者や生物統計家は、「ランダムサンプリングによる正確な推定値」よりも、「ランダム化による妥当な判断を大事にする。そしてたまに社会調査を中心とした統計を教育された者(あるいは単に聞きかじった者)から「ランダムサンプリングでないからこの結果は信用ならない」という批判をもらうと、終わりのない論争に突入する。……両者のうちどちらが正しいか、と言われれば、それは単に学問的な視座の違いによるというだけの話であり、状況によって適した考え方はどちらなのかきちんと考えられることが重要なのである。》(pp.211-213)

[目次]
第1章 なぜ統計学が最強の学問なのか?
 統計リテラシーのない者がカモられる時代がやってきた
 統計学は最善最速の正解を出す
 すべての学問は統計学のもとに
 ITと統計学の素晴らしき結婚

第2章 サンプリングが情報コストを激減させる
 統計家が見たビッグデータ狂想曲
 部分が全体に勝る時
 1%の精度に数千万円をかけるべきか?

第3章 誤差と因果関係が統計学のキモである
 ナイチンゲール的統計の限界
 世間にあふれる因果関係を考えない統計解析
 「60億円儲かる裏ワザ」のレポート
 p値5%以下を目指せ!
 そもそも、どんなデータを解析すべきか?
 「因果関係の向き」という大問題

第4章 「ランダム化」という最強の武器
 ミルクが先か、紅茶が先か
 ランダム化比較実験が社会科学を可能にした
 「ミシンを2台買ったら1割引き」で売上は上がるのか?
 ランダム化の3つの限界

第5章 ランダム化ができなかったらどうするか?
 疫学の進歩が証明したタバコのリスク
 「平凡への回帰」を分析する回帰分析
 天才フィッシャーのもう1つの偉業
 統計学の理解が劇的に進む1枚の表
 重回帰分析とロジスティック回帰
 統計学者が極めた因果の推論

第6章 統計家たちの仁義なき戦い
 社会調査法vs疫学・生物統計学
 「IQ」を生み出した心理統計学
 マーケティングの現場で生まれたデータマイニング
 言葉を分析するテキストマイニング
 「演繹」の計量経済学と「帰納」の統計学
 ベイズ派と頻度論派の確率をめぐる対立

終 章 巨人の肩に立つ方法
 「最善の答え」を探せ
 エビデンスを探してみよう


|

書評」カテゴリの記事