統計学が最強の学問である

統計学が最強の学問である」を読みました。著者紹介を見て、驚きました。西内啓先生は1981年の生まれです。若いのに驚きました。読後の印象からして壮年の教授を想像していました。東京大学医学部出身の新進気鋭の統計学者でした。格好いいね!。生半可な統計学の理解しかない私にとって、前半はともかく、後半はつらいものがありました。分かったことは、ビッグデータなどの流行語は恐れるに足らないこと、新聞雑誌、評論家のデータ分析を鵜呑みにしてはいけないこと、統計学はフィッシャーという天才に大きな影響を受けていること、そしてビジネスマンとして統計学を勉強する必要性でした。備忘します。

統計学が最強の学問である

統計学が最強の学問である

なぜ統計学は最強の武器になるのだろうか?…どんな分野の議論においても、データを集めて分析することで最速で最善の答えを出すことができるからだ。(p.008)
望むと望まざるとにかかわらず、ほとんどすべての学問に関わる学者は統計学を使わざるを得ない時代がすでに訪れているし、統計リテラシーさえあれば、自分の経験と勘以上の何かを人生に活かすことがずいぶんと簡単になる。(p.022)
もしあなたの会社が今、日常業務のコスト削減やサービスの安定性向上のため以外のベネフィット、すなわち、「データから効率の良い経営判断を行うこと」を見込んでビッグデータ技術に投資しようとしているのであれば、せめてこの本をあと数10ページ読んでからにしてほしい。(p.040)
対処しきれない量のデータが存在する際に、適切なサンプリングさえすれば、必要な情報を得るためのコストが激減するのは80年前だろうが現代だろうが本質的には変わらない。にもかかわらず、ビッグデータに関心のあるビジネスマンは、しばしばビッグデータをビッグなままで扱うことにしか目がいかないのだ。(p.047)
…たとえ最終的には全データを対象とした分析や検証が必要になるとしても、やはりまずは適切なサイズのサンプリングデータを使って、探索的解析で仮説の目星をつけた方がいい。(p.55)
【問1】何かの原因が変化すれば利益は向上するのか? 【問2】そうした変化を起こすような行動は実際に可能なのか? 【問3】変化を起こす行動が可能だとしてそのコストは利益を上回るのか? この3つの問に答えられた時点ではじめて「行動を起こすことで利益を向上させる」という見通しがたつのであり…(統計利用の意味はない)(p.059)
…どのようなデータを比較し、その違いを生み出しうる要因を探し当てればよいのか? その答えを一言でいえばごく簡単だ。「目指すゴールを達成したもの」と「そうでないもの」の違いを比較すればいい。(p.087)
…「関連しそうな条件」を考えうる限り継続的に追跡調査し、統計的な手法を用いて、少なくとも測定された条件については「フェアな比較」を行う…(p.097)
もう少し大げさに言い換えるなら、フィッシャーが打ち立てたランダム化比較実験という方法論は、科学の領域そのものを変えたといっても過言ではないのである。(p.110)
こうした現象を「平凡への回帰」と呼び、…「平均値への回帰」と呼ばれるようになった。実際のデータは、理論上の推測よりも「平均値に近づく」という意味である。(p.154)
このたった一枚の表だけでほとんどのデータの関連性を分析したり、将来の結果を予測できたりするという、とてもシンプルかつパワフルな枠組みである。(p.173)
「みんな違ってみんないい」というのは人と接するうえではとてもよい言葉だが、データを分析して結局わかったのが「みんなそれぞれ違う」というのでは話にならないのだ。可能な限りシンプルに、「何が最も結果変数に違いを生むのか」がわかってこそ統計学である。(p.198)