第1回】対談・西内啓(統計家)×飯田泰之(駒澤大学経済学部准教授)(前編)

難しい数式や記号が並びがちな統計学。一般のビジネスマンにはとっつきにくい学問の一つだが、使いこなせれば、あらゆる分野で通用する強力な“武器”となる。


(写真右)西内啓(にしうち・ひろむ)/1981年生まれ。東京大学医学部卒業(生物統計学専攻)。同大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長などを経て、現在は調査・分析などのコンサルティングに従事。

(写真左)飯田泰之(いいだ・やすゆき)/1975年生まれ。東京大学経済学部卒業、同大学院経済研究科博士課程単位取得中退。内閣府経済社会総合研究所、財務省財務総合政策研究所などで客員を歴任、現在は駒澤大学経済学部准教授。主な著書に『思考の型を身につけよう』(朝日新書)など多数。

統計は自分を拡大するツール

飯田 西内さんは医学部のご出身ですが、統計学はどこで学ばれたのですか。

西内 医学部の中でも、公衆衛生学が専門でしたので、統計学は最初に学んだんです。公衆衛生学は原因を突き詰めた後、人々がどのように行動するのか、また、社会構造を変えられるのかといった、ありとあらゆるものが対象になります。経済学を含めた、社会科学全般について、博士課程で学びました。

飯田 なるほど。特に公衆衛生学とか疫学はまさに、統計学の生みの親みたいなものですからね。

西内 疫学とは原因不明の疫病を防止するための学問ですが、その最初の研究が19世紀のロンドンではやったコレラです。当時のロンドン中の医師や科学者、役人が対策を繰り出すのですが、どれも効果がない。そんな中でジョン・スノウという外科医はコレラで亡くなった人の生活状況について調べまくって、同じような状況下でコレラにかかった人とかかっていない人の違いを比べました。

飯田 疫学では、食品摂取などの要因と発症の有無を「四分割表」(用語解説)でクロス分析するのが基本ですが、その最初の例ですね。

西内 スノウの分析では、水道会社Aを利用している家が水道会社Bを利用する家より8.5倍も死亡者が多かったので「とりあえずAの水は使うな、以上」という解決策を打ち出しました。その結果、何十万人もの命が救われました。

 統計学は、データの解析結果に基づき、どんな権威やロジックも吹き飛ばして最善の判断を下す。だから私は「統計学は最強の学問である」と思っています。

飯田 私も、統計学を知らない人にはまず、疫学の四分割表の話をします。世の中にはびこる怪しいデータは大体、四分割表ができていない。

 よくある例が、「このダイエット薬を飲んで70%の人が効果を実感した」といったものですが、そこには、飲まなかった人がどうだったのかについては、一切触れられていない。統計リテラシーがあれば、この手の怪しいデータにはごまかされないでしょう。

西内 適切な比較をしていない事例としては、私も著書の中で、こんな例を書きました。「心筋梗塞で死亡した人の95%が生前に食べていて、強盗や殺人などの凶悪犯の70%以上が犯行前24時間以内に食べていた物があります。この危険な食べ物を禁止すべきか」という問いです。答えは「ご飯」なんですけど(笑)。

飯田 「二水素化酸素」という“毒物”もありますよ。大量に摂取すると死に至り、溺死者のほぼ100%がそれによって死んでいる──。

西内 二水素化酸素。水素が二つに酸素が一つ、つまりH2O(水)ですね。

飯田 ところで、統計がまったくわからないビジネスマンに一つだけ教えるとしたら、何を教えますか。

西内 一つだけなら「P値」(用語解説)について教えます。つまり、「検定」(用語解説)です。実際には何の差もないのに、誤差や偶然によってたまたま差が生じる確率のことです。これがわかれば、自分たちでデータを集計して、意味があるデータなのか、誤差なのかがわかるので、そこからもう一歩踏み出すときに有効になります。

 例えば、こうすればもうかるらしいという新たな発見があるときに、どの要素を動かせばもっともうかるかということがわかるようになります。

飯田 「偶然にすぎない確率が何パーセント」という検定の考え方そのものが、論理の組み立て方として面白いですよね。文系の人は「これは確実だ」と正面突破しようとするのですが、検定を行えば「偶然そうなった可能性が5%以下なので、暫定的に正しいと考えてよいだろう」と言えます。実際、ビジネスの世界では確実なことなんてほとんどなくて、せいぜい確率が高いという程度だから、この検定の考え方は大事です。

西内 たくさんある数字を一気に縮約して、答えが何かを導き出すために、統計学は100年以上かけて取り組んできました。統計を使えば、ものすごくスピードアップにつながりますね。論文や研究、数字よりも経験が大事だという人は多いのですが、実は、その数字には、1000人とか1万人分の経験やデータがぎゅっと詰まっていることが多いんですね。

飯田 確かに、統計学は情報をすごく短くまとめてくれます。逆に言えば、統計的なリテラシーが上がると、情報を伝えるのが楽になるという面もある。

 実は、経営学者には英語がうまい人が多いのに対して、経済学者は下手なんですよね。それは、経済学の実証論文はキーワードと「回帰式」(用語解説)さえ読めば意味がわかるからじゃないかと思うんです。

西内 回帰式とP値さえ与えられれば、自分で試せますからね。

飯田 世の中は複雑化していて、自分一人の経験で何か新しい結論を導き出せるほど単純ではありません。場合によっては、70歳でも経験不足とかあり得ます。それだけ統計は、自分を拡大するツールになっていると思います。

 (後編に続く)

 

  用語解説

四分割表
二つ以上の変数の関係性を分析するための表。この表で分析する手法をクロス分析という。

P値(ピーち)
Probability(確率)の略。実際には何の差もないのに、誤差や偶然によって差が生じる確率のことをいう。P値が大きければ、偶然でも起こり得ると考えられ、小さければ(慣例的には5%以下)、偶然には起こりそうにないレベルの差と考えられる。

検定
100%正しいわけではないが、95%以上正しいのでおおむね正しいと考えて問題ないという推測統計の考え方を応用し、真意の疑わしい主張や仮説に対して、論理的・統計的な否定を行うこと。その否定を数多く繰り返すことで、否定されない仮説が積み上がり、真理に近づくという考え。

回帰式
ある変数と他の変数がどのように相関しているかの関係を把握する際に変数化し、数式化することを回帰分析という。その際の計算式が回帰式(y=ax+b)となる。この際の、a、bを回帰係数という。

Photo by Kazutoshi Sumitomo

週刊ダイヤモンド

この連載について

最強の武器「統計学」【1】~なぜ統計学が最強なのか

週刊ダイヤモンド

1月に発売された『統計学が最強の学問である』(西内啓著/ダイヤモンド社刊)が発行部数12万部のベストセラーになっている。大量のデータが溢れる現代社会では、さまざまな事象を数字で捉え、本質を導き出す統計学という手法、あるいは統計的な思考...もっと読む

関連記事

関連キーワード

コメント

Tweetがありません