ナンバーセンス/カイザー・ファング
データ分析は厄介な仕事で、つねに正しい答えを出せる人などいない。官僚であれ専門家であれ、どんなに優秀な人でも間違える余地は必ずある。なぜなら、完全な情報は存在しないからだ。「一流の学術誌に掲載されている」という言い訳は、「余計な質問をするな」という意味にすぎない。そして、ビッグデータの時代にそんな言い訳は通用しない。
データのどの部分に注目するかによって、分析結果が正反対になる。
重要なのは、どれだけ多くのデータを分析するかではなく、どのように分析するかだ。
ビッグデータは基本的に、因果関係について何かを語るものではない。
データの洪水が、隠れていた因果関係をさらけ出すというのは、ありがちな誤解だ。
データは理論に正当性を与える。
ただし、正しい分析も間違った分析も、すべて何らかの理論にもとづいている。
データを分析する際は、理論上の仮定が不可欠だ。
あらゆる分析はデータと仮説から成る。
データが充実しているほど、より多くの理論を裏づけるが、前述のとおり矛盾する理論の両方を裏づける場合もある。
ビッグデータをもてはやす人々は、データが多いほど的確な分析が増えると思い込みがちだ。
しかし、より多くの人がより多くの分析をより迅速に行えば、より多くの理論や視点が生まれ、複雑さや矛盾や混乱が増えて、明晰さや意見の一致や信頼度が薄れる。
変数の種類が増えれば増えるほど、もっともらしい分析が幾何級数的に増え、誤差や矛盾が生じる可能性もそれだけ増える。
データの量が多ければ、議論や検証、調整、反復可能性の計測などに要する時間は必然的に増え、それだけ疑問や混同が生じる。
ビッグデータは、私たちを前進させるのではなく後退させかねないのだ。
問題のあるデータをかき集めれば、問題のある理論が裏づけられ、正しい理論がかき消されて──科学が暗黒の時代に逆戻りするかもしれない。
問題のあるデータやアナリストを見たときに、何かが違うと感じる。
それがナンバーセンスだ。
ナンバーセンスは、真実に近づきたいという欲望と粘り強さでもある。
自分の分析がどこから生まれ、どこに向かうのかを理解する。手がかりを集め、罠を見抜く。
どこで引き返し、どこで突き進めばいいかを見きわめる知恵であり、立ち止まる分別だ。
数字やグラフに振り回されず、もっともらしい解説や分析を鵜呑みにせずに、データの本質を見きわめる力。
そうした統計のリテラシーを、本書では「ナンバーセンス」と呼ぶ。
ナンバーセンスの大きな要素は「違和感」だ。
ロースクールの早期出願制度が、一部の志願者に学力テストを免除する理由は何か。
レストランの人気料理を半額で食べられる共同購入クーポンは誰が得をして、誰が損をするのか。
公的機関が発表する失業率や消費者物価指数が、私たちの実感とずれるのはなぜか。
そうした違和感を見逃さず、その出所を探るうちに、数字の本当の意味が見えてくる。
「数字はウソをつかない」とよくいう。
しかし、実際には数字はウソをつく。
そのウソを見抜くのがナンバーセンス。
そしてその決めてとなるのが「違和感」だという超人間的なものだというところが非常に興味深い。
« 稼ぐ話術「すぐできる」コツ/金川顕教 | トップページ | ファシズムの教室/田野大輔 »