私たち人間だけでなく、あらゆる動物や昆虫の「知的な行動」は、「探索」と「評価」の少なくともどちらか1つ、あるいは両方であると言うことができます。
知能の一種である将棋プログラムの場合ももちろん「探索」と「評価」をおこなっています。
どういうことか、具体的に見ていきましょう。
将棋プログラムは局面が与えられたとき、まずはコンピュータらしく、一手先のすべての考えられる展開を探索します。
そして局面を評価します。この場合の評価とは、「予想される勝率」と言い換えてもいいでしょう。
局面のなかでもっとも評価がよいものから、順番に次の展開を探索していきます。
しかし、繰り返しになりますが、コンピュータのリソースは限られています。
そこでだんだん探索が進んでいくと、今度はすべての手を調べずに、やはり評価によって、有望そうな展開や有望そうな手にリソースを割くようにします。
こうした探索と評価の組み合わせを、シミュレートといいます。
探索=エミュレート でしたが、
探索+評価=シミュレート と理解していただいても大丈夫です。
エミュレートは機械的で正しさ優先の予想の方法でしたが、シミュレートは「評価」によって何を探索すべきか目星をつけていますから、より深く調べることができます。ただし、間違う可能性は一気に高くなります。そのため、航空・金融・宇宙など安全や正確性がより求められる分野のコンピュータでは、シミュレーションではなくエミュレーションが使われる割合が多いようです。
しかし、将棋ではエミュレーションだけでは、先の先まで調べることができません。より深く調べるためにシミュレートを使わざるを得ません。なのでどうしても、その後の重要な展開を見落とすことがあるのです。
人間と同じようにコンピュータもよい手を見落とすというのは、こうした理由からです。正しく「評価」をし続けなければ、よい手にはたどり着けない、という仕組みは同じなのです。
図1−4 コンピュータもミスをする
評価の仕組みの作り方
cakesは定額読み放題のコンテンツ配信サイトです。簡単なお手続きで、サイト内のすべての記事を読むことができます。cakesには他にも以下のような記事があります。
cakesは定額読み放題のコンテンツ配信サイトです。簡単なお手続きで、サイト内のすべての記事を読むことができます。cakesには他にも以下のような記事があります。