人工知能はどのようにして名人を「超えた」のか

2017年4月1日におこなわれた第2期電王戦第1局は、ポナンザが71手と短時間で佐藤天彦名人を下す結果に終わりました。ポナンザがこれほど強くなった理由として、開発者である山本一成さんは「意味と物語から自由なため」と振り返ります。これはどういうことでしょうか。今回は番外編的に、山本さんには電王戦を含めた最近の出来事を解説してもらいます。

 本連載の原稿は、2017年の2月から4月にかけて書いたものです。その間、私とポナンザ、そしてコンピュータ将棋の世界にとって、大きな出来事が2つありました。

 1つは、将棋で初めて実用レベルのディープラーニングに成功したことです。第10回で、「ポナンザにはディープラーニングは使われていない」と言いましたが、連載を書く途中で事情が変わったことになります。

 囲碁とは異なり、将棋やチェス系のゲームではディープラーニングがうまくいかないのではないか、と私が考えていたのには理由があります。将棋やチェスは、囲碁より合法手(ルール上可能な手)がダイナミックに変化するからです。

 この問題はかなり深刻です。囲碁は言ってしまえば、空白の場所に打てばほぼ間違いなく合法手です。しかし将棋やチェスでは、直前まで合法手だった手がそうでなくなるということが、ごく普通にあります。さらに王手がかかれば、指せる手は大きく変化します。

 実際、チェスでディープラーニングを試したという論文がいくつかありましたが、あまりうまくいってないようでした。私も同じく、何年もディープラーニングを将棋に使うことを試みましたが、なかなかうまくいきませんでした。

 それがなぜ実現できたか。データ量を増やして、最新のディープラーニングの知見を入れていったら自然にできるようになった、というのが1つの理由です。加えて、とくに凝ったことをせずに、ディープラーニングにすべてを任せるようにしたことがポイントでした。

 合法手をどうやってディープラーニングに教えればよいのか、ずっと苦心していました。しかしそれはいらぬ苦労でした。私がディープラーニングにしてあげたほうがいいと思ったことが、ディープラーニングにとってはむしろ邪魔だったのです。

 ディープラーニングは、最もよい手を教えてあげれば、自然と、どの手が合法手か非合法手かの区別もつくようになったのです。私はディープラーニングに、駒の動かし方はもちろん、王手のことも、二歩(にふ)というルールのことも何ひとつ明示的には教えていません。ただ、この局面で最もよいのはこの手だと、ひたすら教え続けたのです。

 その結果、恐るべきことに、いつの間にかディープラーニングは将棋のルールを会得していたのです。しかし、これはある意味当然かもしれません。人間も、ある程度将棋に慣れれば、合法手なんて考えませんものね。「いま指そうとしている手がルールどおりなのか?」とわざわざ考えるのは、ごく初心者のうちだけなのです。

 ポナンザは今後、アルファ碁と同じようなルートをたどって強くなる可能性が高いでしょう。具体的には、アルファ碁がディープラーニングと既存のモンテカルロ法との組み合わせだったように、ポナンザも、ディープラーニングと既存の手法の組み合わせにチャレンジすることになります。

 そのポテンシャルがどこまであるのか、現時点ではまだまったくわかりません。しかし私は、ディープラーニングの将来性に確信を持っています。

わざと歩を渡して防御を固める

 本連載の執筆中に起きた2つ目の出来事は、2017年4月1日におこなわれた第2期電王戦において、現役の「名人」にポナンザが勝利したことです。

この続きは有料会員登録をすると
読むことができます。
cakes・note会員の方はここからログイン

1週間無料のお試し購読する

cakesは定額読み放題のコンテンツ配信サイトです。簡単なお手続きで、サイト内のすべての記事を読むことができます。cakesには他にも以下のような記事があります。

人気の連載

おすすめ記事

この連載について

初回を読む
人工知能はどのようにして「名人」を超えるのか?

山本一成

2016年、電王戦で5戦全勝した将棋AIポナンザ。開発者である山本一成さんは「知能とは何か?」「知性とは何か?」ということを何度も自問することになったそうです。そうすることで、逆に人間の知能がクリアに見えてきたと言います。この思考の結...もっと読む

この連載の人気記事

関連記事

関連キーワード

コメント

takehirosan1209 @retroeater @krpphilosophy https://t.co/yEMrHXJ5mn 5ヶ月前 replyretweetfavorite

ounziw 「いつの間にかディープラーニングは将棋のルールを会得していたのです。」https://t.co/F7ySIJGHtv これが本当なら凄い。elmo vs ponanza の決勝戦からは、ponanza が打ち歩詰めルールを把握していたと思われるから。 5ヶ月前 replyretweetfavorite

drken1215 ・将棋やチェスは、囲碁より合法手がダイナミックに変化するからディープラーニング手法を取り入れることが難しい。 ・合法手をどうやってディープラーニングに教えればよいのか、ずっと苦心していました。しかしそれはいらぬ苦労でした。 https://t.co/Tq0FHcWN3R 6ヶ月前 replyretweetfavorite

kawamuramasahar ディープラーニングは最もよい手を教えてあげれば合法手と非合法手の区別もつくようになった 駒の動かし方、王手、二歩も明示的には教えていない その結果いつの間にか将棋のルールを会得していた # 6ヶ月前 replyretweetfavorite