« 稼ぐ話術「すぐできる」コツ/金川顕教 | トップページ | ファシズムの教室/田野大輔 »

2021年2月25日 (木)

ナンバーセンス/カイザー・ファング

Photo_20210218063201

 データ分析は厄介な仕事で、つねに正しい答えを出せる人などいない。官僚であれ専門家であれ、どんなに優秀な人でも間違える余地は必ずある。なぜなら、完全な情報は存在しないからだ。「一流の学術誌に掲載されている」という言い訳は、「余計な質問をするな」という意味にすぎない。そして、ビッグデータの時代にそんな言い訳は通用しない。

データのどの部分に注目するかによって、分析結果が正反対になる。

重要なのは、どれだけ多くのデータを分析するかではなく、どのように分析するかだ。

ビッグデータは基本的に、因果関係について何かを語るものではない。

データの洪水が、隠れていた因果関係をさらけ出すというのは、ありがちな誤解だ。

データは理論に正当性を与える。

ただし、正しい分析も間違った分析も、すべて何らかの理論にもとづいている。

データを分析する際は、理論上の仮定が不可欠だ。

あらゆる分析はデータと仮説から成る。

データが充実しているほど、より多くの理論を裏づけるが、前述のとおり矛盾する理論の両方を裏づける場合もある。

ビッグデータをもてはやす人々は、データが多いほど的確な分析が増えると思い込みがちだ。

しかし、より多くの人がより多くの分析をより迅速に行えば、より多くの理論や視点が生まれ、複雑さや矛盾や混乱が増えて、明晰さや意見の一致や信頼度が薄れる。

変数の種類が増えれば増えるほど、もっともらしい分析が幾何級数的に増え、誤差や矛盾が生じる可能性もそれだけ増える。

データの量が多ければ、議論や検証、調整、反復可能性の計測などに要する時間は必然的に増え、それだけ疑問や混同が生じる。

ビッグデータは、私たちを前進させるのではなく後退させかねないのだ。

問題のあるデータをかき集めれば、問題のある理論が裏づけられ、正しい理論がかき消されて──科学が暗黒の時代に逆戻りするかもしれない。

問題のあるデータやアナリストを見たときに、何かが違うと感じる。

それがナンバーセンスだ。

ナンバーセンスは、真実に近づきたいという欲望と粘り強さでもある。

自分の分析がどこから生まれ、どこに向かうのかを理解する。手がかりを集め、罠を見抜く。

どこで引き返し、どこで突き進めばいいかを見きわめる知恵であり、立ち止まる分別だ。

数字やグラフに振り回されず、もっともらしい解説や分析を鵜呑みにせずに、データの本質を見きわめる力。

そうした統計のリテラシーを、本書では「ナンバーセンス」と呼ぶ。

ナンバーセンスの大きな要素は「違和感」だ。

ロースクールの早期出願制度が、一部の志願者に学力テストを免除する理由は何か。

レストランの人気料理を半額で食べられる共同購入クーポンは誰が得をして、誰が損をするのか。

公的機関が発表する失業率や消費者物価指数が、私たちの実感とずれるのはなぜか。

そうした違和感を見逃さず、その出所を探るうちに、数字の本当の意味が見えてくる。

「数字はウソをつかない」とよくいう。

しかし、実際には数字はウソをつく。

そのウソを見抜くのがナンバーセンス。

そしてその決めてとなるのが「違和感」だという超人間的なものだというところが非常に興味深い。

« 稼ぐ話術「すぐできる」コツ/金川顕教 | トップページ | ファシズムの教室/田野大輔 »

書籍・雑誌」カテゴリの記事