将棋における「探索」と「評価」とは

開発当初はとても弱かった将棋プログラムは、どのようにして人間のトッププロたちに実力で勝てるようになったのか。その問いに答えるためには「知能とは何か」について知らなければならないと山本一成さんは解説します。どういうことでしょうか。

 私たち人間だけでなく、あらゆる動物や昆虫の「知的な行動」は、「探索」と「評価」の少なくともどちらか1つ、あるいは両方であると言うことができます。
 知能の一種である将棋プログラムの場合ももちろん「探索」と「評価」をおこなっています。
 どういうことか、具体的に見ていきましょう。

 将棋プログラムは局面が与えられたとき、まずはコンピュータらしく、一手先のすべての考えられる展開を探索します。
 そして局面を評価します。この場合の評価とは、「予想される勝率」と言い換えてもいいでしょう。
 局面のなかでもっとも評価がよいものから、順番に次の展開を探索していきます。

 しかし、繰り返しになりますが、コンピュータのリソースは限られています。
 そこでだんだん探索が進んでいくと、今度はすべての手を調べずに、やはり評価によって、有望そうな展開や有望そうな手にリソースを割くようにします。

 こうした探索と評価の組み合わせを、シミュレートといいます。
 探索=エミュレート でしたが、
 探索+評価=シミュレート と理解していただいても大丈夫です。

 エミュレートは機械的で正しさ優先の予想の方法でしたが、シミュレートは「評価」によって何を探索すべきか目星をつけていますから、より深く調べることができます。ただし、間違う可能性は一気に高くなります。そのため、航空・金融・宇宙など安全や正確性がより求められる分野のコンピュータでは、シミュレーションではなくエミュレーションが使われる割合が多いようです。

 しかし、将棋ではエミュレーションだけでは、先の先まで調べることができません。より深く調べるためにシミュレートを使わざるを得ません。なのでどうしても、その後の重要な展開を見落とすことがあるのです。

 人間と同じようにコンピュータもよい手を見落とすというのは、こうした理由からです。正しく「評価」をし続けなければ、よい手にはたどり着けない、という仕組みは同じなのです。

図1−4 コンピュータもミスをする

評価の仕組みの作り方
この続きは有料会員登録をすると
読むことができます。
cakes・note会員の方はここからログイン

1週間無料のお試し購読する

cakesは定額読み放題のコンテンツ配信サイトです。簡単なお手続きで、サイト内のすべての記事を読むことができます。cakesには他にも以下のような記事があります。

人気の連載

おすすめ記事

この連載について

初回を読む
人工知能はどのようにして「名人」を超えるのか?

山本一成

2016年、電王戦で5戦全勝した将棋AIポナンザ。開発者である山本一成さんは「知能とは何か?」「知性とは何か?」ということを何度も自問することになったそうです。そうすることで、逆に人間の知能がクリアに見えてきたと言います。この思考の結...もっと読む

この連載の人気記事

関連記事

関連キーワード

コメント

Singulith >「また皆さんは、どうやって「歩いているか」説明できますか?  右足を前にして、左足を前にするという説明ではダメですよ。もっと正確に、腰の角度とか膝の上げ具合を説明できなければダメです」  https://t.co/iAU2qNUAdO 6ヶ月前 replyretweetfavorite

vertica7 “時代が進むにつれてわかってきたのは、「人間は、自分が理解していることを漏れなく説明することができない」という、驚きの事実でした” -【人工知能はどのようにして「名人」を超えるのか?】 6ヶ月前 replyretweetfavorite

nazenazeboy "何が難しかったのか。時代が進むにつれてわかってきたのは、「人間は、自分が理解していることを漏れなく説明することができない」という、驚きの事実でした。 将棋の例に戻れば、私は将棋が強いほうですが、なぜ将棋でよい手を選べるかう" / https://t.co/PHoDV63lS8 6ヶ月前 replyretweetfavorite

poker_japan 計算力と記憶力に優れたコンピュータだが、人間の知恵をコンピュータに授けることは難しかった。 6ヶ月前 replyretweetfavorite