当たる予測と外れる予測を分けるものは何か?
ネイト・シルバー(川添節子訳、西内啓解説)「シグナル&ノイズ 天才データアナリストの「予測学」」、日経BP社(2013)
お奨め度:★★★★★
野球選手のパフォーマンスを予測する理論"PECOTA"を開発したことでも知られるネイト・シルバーが「予測」をテーマに書いた本。当たる予測と外れる予測を分けるものは何か、その可能性と限界はどこにあるのかなどの問題について、事例に基づき考察している。
原書が出たのは1年半くらい前で話題になったが、なによりも"The Signal and the Noise"というタイトルのインパクトがあった。えっ、SN比(ノイズに対してシグナルがどの程度の比率で存在しているか)を扱った本?SN比が高けれ ば雑音の影響が小さく、SN比が低ければ雑音の影響が小さいことになる。ただし、何がノイズで何がシグナルかは解釈の問題になる。
しかし、副題は"Why So Many Predictions Fail-but Some Don't"となっている。テーマにした一般的な現象を解明しようとする本が出てくるとは思わなかった。
この本はシグナルを有益な情報だとし、ノイズは雑音と考え、ある情報の中からシグナルとノイズを切り分け、いかにシグナルだけを基にした推論が行えるかが、予測の精度を高めるという前提で話を進めている。
こ こで問題になるのは、いま注目のビックデータだ。データ量が増えれば、情報も増える代わりにノイズも増え、一般的にSN比は小さくなる。つまり、シグナル を拾うことが難しくなるのだ。そう考えると、データ量が多いからといって、未来予測が容易になるわけではないことになる。
さらに、予測には人間の心理的傾向や、社会的・政治的インセンティブが絡んでくる。このために純粋な予測にはならないことが多い。たとえば、天気予報は傘を持っていない人が雨が降ると嫌がるので、降水確率を高めに出す傾向があることは実証されている。
このような切り口で、
経済破綻
選挙
スポーツ
天気予報
巨大地震
インフルエンザ
ギャンブル
チェス
ポーカー
金融市場
地球温暖化
テロリズム
について、それぞれの分野においての予測モデルと、その限界を議論している。600ページと膨大なページ数なのだが、読み出したら止まらないくらい面白い。
ビックデータを業務の中に取り入れている人、未来予測に興味がある人は、必読の一冊だ。
コメント