未来予測を嗤え!

第2回】未来を予測することは可能か?

12月10日に発売された「未来を予測することは可能か?」「ビッグデータの本当の意味」「人工知能の可能性」などといった現代科学の問いに対し、プログラマーにして人気の書評家・小飼弾さんと、気鋭の数学者・神永正博さんが語り尽くす対談書『未来予測を嗤え!』。本連載では書籍の内容の一部を紹介していきます。第2回は、本書の対談の冒頭部分をご紹介します。


未来予測本がバカ売れする理由

—古代から、人々は未来がわからないことに不安を感じ、占いや科学を使って未来を予測しようとしてきました。特に最近は世界情勢を不安定にする出来事が続いているせいか、「2030年に世界はどうであるか?」とか「2050年の世界経済はどうなっているか?」といった未来予測本も売れているようです。
 小飼さんや神永さんは、未来を予測できると思いますか?

小飼 最悪なのは、未来は決定しているのだけれど、人間が予測することはできないというケースですね。

—そう来ましたか。

神永 例えば、カオス理論(予測できない複雑な振る舞いを示す現象を扱う理論)というものがあります。よく誤解されがちなんですが、数学でいうカオスというのはランダムのことではありません。現象は完全に決定論的なんですが、振る舞いが複雑すぎて長期的な予測は不可能になります。

小飼 わかりやすく例えると、パチンコかな。プレイヤーが玉を弾いた瞬間、玉がどこに落ちるかは決定しています。けれど、プレイヤーがそれを知ることはできない。わかるんだったら、ギャンブルとして成立しません。決まっているけどわからないという現象は、たくさんあるんですよ。
 もしかしたら、我々は自由意思で行動していると思っているけど、それもたんなるカオスなのかもしれません。
 今のところ、自由意思の存在は証明されていなくて、どちらかというと不存在の証拠の方が多いんですよ。有名なのは、1980年代に行われたリベットの実験です。被験者に手首を曲げてもらって、その際の脳活動を観察したところ、被験者が「手首を曲げよう」と意識する1/3秒前に、すでに脳の活動は始まっていることがわかりました。

—私たちの意識は、決定された現象に対して一喜一憂しているだけなのかもしれないと。

神永 その可能性はけっこう高いと思っています。私たちが考えていることのほとんどは、外界の刺激に反応しているだけなのかもしれませんよ。全体としてみると複雑すぎてわからないだけで。さらにいえば、統計によってわかる相関関係にも意味はないのかもしれません。
 例えば、よく使われる統計学の手法として回帰分析があります。回帰分析というのは、ある目的変数がどんな説明変数に影響を受けているのかを調べるために使われます。「人の幸福度には、友達の数や年収などの説明変数が、これくらいの重み付けで影響している」といった分析があったりしますね。
 しかしこれは、本当の説明変数はもっと複雑な関係になっているのかもしれないけれど、それをとりあえず単純な式(多くは一次式)で表してみたというだけです。こうした統計的な分析で本質的に何がわかるのかはかなり難しい問題で、実際のところはおまじないが進化したようなものかもしれませんね。

「科学」も実はいいかげん

—だとすると、分析をして何かを予測することは無意味なんでしょうか?

神永 社会現象を予測するのは難しいことが多いでしょう。逆に、もっとはっきりわかるはずのことを多くの人は無視しがちです。
 自分の家族の年齢を考えてみてください。子どもは6歳になったら小学校に入学しますし、中学や高校にいつ行くのかも決まってきます。年功序列の会社だったら、社員の年齢からだいたい誰がどんな役職に就くか見当がつくでしょう。両親の年齢で健康状態の変化もある程度わかります。人口動態(一定期間に出生、死亡、結婚、移動などによって生ずる人口の変動)も同じことです。例えば、東北六県の18歳人口は減り続けていて、2019年には現在から1万人減って8万5000人以下になると予想されています。でも、こうした当たり前の予測に基づいて先手を打って対応する人はあまりいません。

小飼 そう、東日本大震災よりもはるかにすさまじい影響があることが、今の段階でもはっきり見えているんです。

—経済に関する予測はどうでしょう? 自信満々に、株価や経済の予測をしているアナリストや経済学者は多いですよね?

神永 以前、『ウソを見破る統計学』(講談社ブルーバックス、75ページ)でも書いたんですが、「儲かる」株のポートフォリオを作るなんてことは、誰にでもできますよ。過去何十年かの株価データを集めて、そこからあまり下がらなかった銘柄を選んで、適当にブレンドすれば出来上がりです。
 嘆かわしいことに、似たようなことが、科学の世界でも行われています。実験結果に他の値から大きく外れた「外れ値」が含まれていて、これさえなければ有意な結論が出せるのに……という場合、外れ値のデータを除外して論文を書いてしまう人がいる。

小飼 統計学者にいわせると、すべての奇数が素数になるそうですよ。3は素数、5も素数、7も素数。9は「たまたま外れただけ」で、11はまた素数(笑)。

神永 論文を査読する側は、有意な結果が出ていなかったら論文と認めないわけですからね。しかも、自分が行った実験ではそうなったと言われれば、除外されたデータは見えないから確認しようがないわけで。

小飼 教科書に載っている歴史的な実験でもそういうことがありました。ミリカンは、1909年に行った油滴実験(2枚の金属電極間で、帯電させた油滴を静止させた)によって電子の電荷を測定しました。ミリカンの測定結果は、現在認められている値から1%程度ずれているだけと極めて精度の高いものです。
 しかし、『背信の科学者たち』(ウイリアム・ブロード/ニコラス・ウェイド著、牧野賢治訳、講談社ブルーバックス)によると、実際の実験ではこれほどきれいな値は出ておらず、都合のよいデータを選択したと指摘されています。

神永 メンデルの遺伝の法則もそうですね。彼の実験結果は、理論に合いすぎているんです。本当なら、もうちょっと外れた値がある程度は含まれるはずなんですよ。

小飼 メンデルは、「分散」の概念を知らなかっただろうなあ。結局のところ、統計というのは分散がわかって初めて意味を持つわけですから。

神永 逆に言うと、学校で普通に習う統計は「分散が存在する」世界でしか通用しないわけです。

—「分散」とは何でしょう?

神永 「分散が存在する」というのは、ランダムネス(無作為さの度合い)がおとなしいということです。分散が存在する場合、データをたくさん採った時に、何らかの値に近づいていきます。
 しかし、経済や株価のデータを精密に研究した結果、どうやら分散が存在しないことがわかってきました。分散が存在しないとなると、「標本を多く集めれば集めるほど、より母集団に近い推測ができる」とは言えなくなってしまうんですね。
 分散がない世界について、私たちはほとんど何も知りません。唯一そこに挑戦したのは、フラクタル理論を築いた数学者のマンデルブロたちくらいのものでしょう。

—では、経済学などは「ないかもしれないものをあるという前提」で理論を構築しているわけですか。

神永 そうです。投資の世界では、分散投資におけるリスクを算出するために、現代ポートフォリオ理論(合理的な投資家がどのように分散投資を行うかを決定する理論)が用いられていますが、これなどもすべて「分散が存在する」ことが前提です。現代ポートフォリオ理論は、ノーベル経済学賞を受賞したマーコウィッツの理論をもとにしていますが、彼の理論は言ってしまえば二次関数の研究です。ちょっとややこしくしているとはいえ、二次関数を研究して、ノーベル賞がもらえるというのは何だかすごいですね。もちろん実際にある程度役に立つ理論ではありますが、数学科の大学院生なら、そんな論文では卒業できませんよ(笑)。

予測できない未来への最良の方法とは?

—人間が未来予測できることがあるとしたら、どんなことでしょう?

この続きは有料会員登録をすると
読むことができます。
cakes会員の方はここからログイン

1週間無料のお試し購読する

cakesは定額読み放題のコンテンツ配信サイトです。簡単なお手続きで、サイト内のすべての記事を読むことができます。cakesには他にも以下のような記事があります。

人気の連載

おすすめ記事

角川新書

この連載について

初回を読む
未来予測を嗤え!

小飼弾 /神永正博

統計学やビッグデータの普及によりいろいろな分野で未来を予測することが可能になった。しかし予測では知ることがきない、人類にとって大事なことがある。人気の書評家と気鋭の数学者による白熱講義!

この連載の人気記事

関連記事

関連キーワード

コメント

nazenazeboy "しかし、経済や株価のデータを精密に研究した結果、どうやら分散が存在しないことがわかってきました。分散が存在しないとなると、「標本を多く集めれば集めるほど、より母集団に近い推測ができる」とは言えなくなってしまうんですね。 分" / https://t.co/VrSZmaaqMF 3年以上前 replyretweetfavorite

kadokawaone21 NHK「NEXT WORLD」にて放送されていた「未来予測」。統計学者とプログラマーは果たしてどう捉えているのか? 超理系講義をお楽しみください!→ 6年弱前 replyretweetfavorite

nazenazeboy "しかし、経済や株価のデータを精密に研究した結果、どうやら分散が存在しないことがわかってきました。分散が存在しないとなると、「標本を多く集めれば集めるほど、より母集団に近い推測ができる」とは言えなくなってしまうんですね。" 6年弱前 replyretweetfavorite