サイコロにも知能がある!?

前回の記事で、山本一成さんは「モンテカルロ法」(ランダムを使って何かを推定する方法)を使うと、今まで弱かった囲碁プログラムを強くすることができたと言います。ランダムをどのように囲碁に適用するのか、その理屈に迫ります。

 囲碁にモンテカルロ法を適用するには、どうすればよいでしょうか?
 その原理は驚くほど簡単です。ある局面にランダムで石を打ち、その結果、勝ったか負けたかの情報を収集していけばいいのです。具体的な例を見ていきましょう(ちなみに、将棋は「指す」もの、囲碁は「打つ」ものです)。

図3-14 囲碁へのモンテカルロ法の適用
同じ局面でランダムに石を打ってみる。

 たとえば、図3-14のA地点に碁石を打ったあと、適当に局面を進めるということを1000回試してみます。そうしたら600回勝って、400回負けたとします。これは勝率60%ですね。

 次に、先ほどと同じ局面でB地点に碁石を打つのを1000回試してみたら、300回勝って700回負けたとします。この場合の勝率は30%です。この結果を見れば、ほぼ確実にAに打ったほうがいいことがわかりますよね。

 これ、すごい考え方だと思いませんか?  だって、「評価」を一度もせずに「探索」だけで、囲碁でどの手を打つかという問題を解決してしまったのですから(「評価」と「探索」については第2回を参照)。

 コンピュータ囲碁では評価を作れなくてずっと困っていたという話をしましたが、この方法は、なんと評価を諦めたのです。評価ではなく「サイコロ」に委ねた、とも言えます。

 これは、人間のようにきちんと「探索」して「評価」するやり方に比べると、かなり奇妙なやり方に思えます。

 しかし私は、これも知能だと考えています。「サイコロには知能がある」とすら言えるかもしれません。

 そんなバカな、と思われるでしょうか。しかし「サイコロには知能がない」ということは、「脳内のニューロンが、隣のニューロンに信号を伝えていること」を知能がないというのと、私には一緒のことに思えます。この世界には、私たち人間以外の知能が存在するのです。

モンテカルロ囲碁の成長

 このモンテカルロ囲碁は、最初から強かったわけではありません。さまざまな工夫が重ねられ、強くなっていきます。

 とりわけ大事な点は、「いかにそれっぽく打ち手を進められるか」でした。単純にランダムに囲碁盤を石で埋めていくより、プロのような打ち回しで埋めたほうがよい結果になるという理屈です。

 ここで機械学習が使われました。モンテカルロ法をしている最中にも、囲碁のプロ棋士と同じような手が打てるよう、プログラムが学習していきます。囲碁というゲームの「評価」を学習することは困難だったのですが、プロの手をコンピュータが真似することはそれなりにできたのです。

 モンテカルロ囲碁が発明されて、旧来手法の囲碁プログラムは一気に廃れました。そしてアマチュアの級位者レベル(つまり初段未満の実力)だったプログラムが、わずか数年で一気に高段クラスまで到達したのです。

 あまりの改善速度の速さに、きっとこのままモンテカルロ法でプロの囲碁棋士も倒せるようになるだろうと、楽観的な意見が出てくるまでになりました。

 しかし、あるレベルで急速に成長がとまります。ちょうどアマチュアトップレベルに届かないくらいです。そこから囲碁プログラマたちの苦闘が続きますが、数年間ほとんど棋力が伸びない状況が続きます。

 サイコロだけでは人間は倒せないのでしょうか。

アルファ碁が示したこと
「囲碁は画像だった」
この続きは有料会員登録をすると
読むことができます。
cakes・note会員の方はここからログイン

1週間無料のお試し購読する

cakesは定額読み放題のコンテンツ配信サイトです。簡単なお手続きで、サイト内のすべての記事を読むことができます。cakesには他にも以下のような記事があります。

人気の連載

おすすめ記事

この連載について

初回を読む
人工知能はどのようにして「名人」を超えるのか?

山本一成

2016年、電王戦で5戦全勝した将棋AIポナンザ。開発者である山本一成さんは「知能とは何か?」「知性とは何か?」ということを何度も自問することになったそうです。そうすることで、逆に人間の知能がクリアに見えてきたと言います。この思考の結...もっと読む

この連載の人気記事

関連記事

関連キーワード

コメント

nazenazeboy "しかし私は、これも知能だと考えています。「 3ヶ月前 replyretweetfavorite

retroeater @krpphilosophy @takehirosan1209 ? https://t.co/SZMCPb268M 3ヶ月前 replyretweetfavorite

nouthuca それぞれの手についてその後をランダムで試行することでどちらの選択肢のほうが勝率がいいかでどちらがよりよい手かを評価する ? https://t.co/VegkSTYwEp 4ヶ月前 replyretweetfavorite

prisonerofroad #science #technology #囲碁 4ヶ月前 replyretweetfavorite