これまでの連載で、機械学習という技術によって、人工知能がプログラマから「卒業」したことをお話ししました。この卒業は、人工知能の開発を飛躍的に進歩させたのですが、同時に科学者やプログラマは困った状況になりました。
それは、「解釈性と性能のトレードオフ」——つまり人工知能の性能を上げるほど、なぜ性能が上がったのかを説明できなくなる、ということです。この傾向は、すでに人工知能の開発における前提や、一種の原則のようになっています。
理由がわからないのに強くなる。人工知能という現代科学の最前線で、なぜそんなことが起きているのか。これからはその説明をしていきましょう。
突然ですが、皆さんは「黒魔術」という言葉をご存知でしょうか。おとぎ話やファンタジーの世界で、魔女が不思議な薬を作るときに使われるような魔法のことです。ぐつぐつと煮えたつ大鍋の前に立ち、意味不明な呪文とともに材料を投げ入れると、煙とともに目的の妙薬ができる……そんなシーンをアニメ作品で観たことがある人も多いと思います。
驚かれるかもしれませんが、この「黒魔術」は機械学習の世界でもスラングとして定着しており、どうやって生まれたのか、あるいはなぜ効果が出るのかわからない技術の総称となっているのです。
当然ながら、人工知能を研究する学問分野である情報科学は、もともと論理や数学が支配する世界でした。理由や理屈がすべてを説明できる世界だったということですね。しかし、現代の情報科学では(とりわけ人工知能の分野では)、だんだんと黒魔術の影響力が強くなってきています。
黒魔術化しているポナンザ
黒魔術の影響は、当然ポナンザにも及んでいます。ポナンザは私が開発したプログラムなので、細部まできちんと考えて作っています。しかも私は、将棋プログラムという狭い領域のことなら、世界でもトップレベルでよく理解しています。
それでも、ポナンザにはたくさんの黒魔術が組み込まれており、すでに理由や理屈はかなりの部分でわからなくなっています。
プログラムの理由や理屈がわからないとは、たとえばプログラムに埋め込まれている数値がどうしてその数値でいいのか、あるいはどうしてその組合せが有効なのか、真の意味で理解していないということです。せいぜい、経験的あるいは実験的に有効だったとわかっている程度です。
もう少し具体的に説明してみましょう。
現在のポナンザの改良方法は、何らかの新しい改良を考えたら、それを適用したポナンザと以前のバージョンのポナンザを3000試合ほど自動で対戦させるというものです。このとき、新しいポナンザの勝率が52%以上の場合に新しい改良が採用されるという方針をとっています。
私が3000試合の将棋の内容を個別に見ることはなく、統計処理をして計測しています。正確には、将棋の内容を吟味しようにも対局の勝因や敗因がわからないので、吟味できません。すでにポナンザの棋力は、私のレベルを遥かに上回っているからです。
しかも、「改良した作業」とポナンザが「強くなったこと」が、将棋のプレイヤーとしての感覚からは大きく乖離していて、理詰めではその乖離を縮めることができません。うまくいった改良がどこでどう有効に働いたのか、全然わからないのです。
加えてこういった改良の成功率は、今までの経験則によると2%以下です。何らかの改良をして3000試合やってみても、強くなることが確認できるのは100回に2回もないということですね。
そんなわけで、現在のポナンザの改良作業は、真っ暗闇のなか、勘を頼りに作業しているのとほとんど変わりがありません。これは絶対うまくいく、と思った改良が成功しないことは日常茶飯事で、たまたまうまくいった改良をかき集めている、というのが実情です。そのため、たまたまうまくいった改良は、私から見るとますます黒魔術のように見えるのです。