アルファ碁の登場

「強化学習」という技術の導入によって、ポナンザをさらに強くした山本一成さんは、囲碁プログラムに参入しようとしたそうです。しかし、今まで開発してきた将棋と囲碁のあいだには大きな「壁」があることに気づいたとのこと。それはいったい何でしょうか。

 2016年、コンピュータ将棋の大会で連続して優勝し、自信のついてきた私はお隣の世界である囲碁プログラムに挑戦しようと考えました。コンピュータ将棋の大会の優勝インタビューでもそのことを宣言して、さっそく囲碁プログラムにとりかかりました。

 しかしそれからわずか1か月後、衝撃的なニュースが飛び込んできます。グーグル傘下のディープマインド社がアルファ碁を開発し、ヨーロッパで最も強い囲碁棋士を破ったというのです。

 ディープマインド社はグーグルが買収した人工知能のエキスパート集団です。とりわけ彼らが得意なことはディープラーニング、そして強化学習です。この2つの組み合わせで彼らを上回るパフォーマンスを出せるチームはほとんどいないでしょう。

 当時の囲碁プログラムの実力は、甘めに見てもアマチュアトップレベルに届かないものでしたので、アルファ碁が既存のプログラムのレベルを大きく超えていることは明らかでした。そして、それから数か月後にアルファ碁が世界有数のプロ棋士、イ・セドル九段と戦うことを宣言したのです。

 その勝敗と、世界が受けた衝撃はすでにお話ししたとおりです。私もその結果を受けてすぐに、囲碁棋士・大橋拓文六段とアルファ碁についてcakesで語り合いました。その全文はぜひこちらからお読みください。

 私がアルファ碁に受けた衝撃はそちらに譲るとして、ここではいかにしてアルファ碁が強くなったかを解説していきます。

なぜ、コンピュータにとって
囲碁だけが特別なゲームだったのか?

 まずは、囲碁プログラムがどのような歴史を辿ってきたのかをお話ししましょう。

 コンピュータがすでに人間の名人レベルに到達したオセロとチェスは、基本的にはコンピュータ将棋と同じ理屈で動いています。正確には、欧米において「知的さの象徴」であったチェスを多くのプログラマたちが研究し、将棋やオセロはその研究を転用して成長してきました。

 ちなみに、チェスを自動で指すという意味でのコンピュータチェスの歴史は古く、1940年代にコンピュータが生まれる前から論文が存在しています。

 有名なところではフォン・ノイマンが中心になったゲーム理論に関する論文“Theory of Games and Economic Behavior”があり、その内容はチェスの計算可能性を示すという、当時としては驚くべきものでした。

 今となっては、「チェスは計算可能」というのは当然のことように聞こえるかもしれません。でも1940年代には、計算機でチェスを指せるようになるとは、ほとんど誰も思ってもいませんでした。

 ちょうどいま、多くの人が「翻訳は計算可能なこと」だと聞いても、どうやって計算するのかまったく予想もつかないのと同じことです。これを考えれば、「チェスは計算可能」という概念がいかに斬新であったか理解できると思います。

図3-10 “Theory of Games and Economic Behavior” 60周年記念エディションの装丁。
チェスの画像があしらわれている。

 しかし、それらの蓄積と研究をものともしないゲームが1つ、本当に1つだけありました。それが囲碁です。なぜ囲碁にだけは、コンピュータチェス・将棋・オセロの手法が通用しなかったのでしょうか?

 その答えは、コンピュータに囲碁の局面を「評価」させることが、どうしてもできなかったからです。

 コンピュータ将棋は「探索」と「評価」の組合せであると第2回で述べました。コンピュータ囲碁ももちろん同じように探索をすることができます。しかし、評価する部分がどうしてもできなかったのです。

 コンピュータ将棋も評価の部分を機械学習することで、格段に強くなったと言いました。 囲碁も同じように機械学習をすればいいかと思いますよね。でも、それではうまくいかないのです。

 以前、チェスと将棋では壁があるといいました(第5回参照)。しかし将棋と囲碁のあいだにも、さらに壁があるのです。

図3-11 チェス・将棋・囲碁のあいだにある壁

 将棋の機械学習では、駒と駒との位置関係すべてに点数をつけることで成功を収めました。ポナンザの場合、調整の対象となった「位置関係」は1億に及びましたが、機械学習であればそれは可能でした。

 しかし囲碁では、そもそもどの関係に点数をつければいいかわからないのです。石と石の関係に点数をつけようと思っても、どの石と石の関係に注目すればいいかがわかりません。

 つまり将棋と囲碁のあいだにある壁は、「何を評価すればいいかがわかる」「わからない」の壁だったのです。

 それでも、なんとかして囲碁の評価を作ったプログラマたちもかつていたのですが、残念ながらそれはとても弱いプログラムでした。

モンテカルロ法という救世主
この続きは有料会員登録をすると
読むことができます。
cakes・note会員の方はここからログイン

1週間無料のお試し購読する

cakesは定額読み放題のコンテンツ配信サイトです。簡単なお手続きで、サイト内のすべての記事を読むことができます。cakesには他にも以下のような記事があります。

人気の連載

おすすめ記事

この連載について

初回を読む
人工知能はどのようにして「名人」を超えるのか?

山本一成

2016年、電王戦で5戦全勝した将棋AIポナンザ。開発者である山本一成さんは「知能とは何か?」「知性とは何か?」ということを何度も自問することになったそうです。そうすることで、逆に人間の知能がクリアに見えてきたと言います。この思考の結...もっと読む

この連載の人気記事

関連記事

関連キーワード

コメント

yuko88551 〔コラム〕 9日前 replyretweetfavorite

msk3345 {コラム} 14日前 replyretweetfavorite

yuko88551 〔コラム〕 14日前 replyretweetfavorite

nazenazeboy "つまり将棋と囲碁のあいだにある壁は、「何を評価すればいいかがわかる」「わからない」の壁だったのです。 " 15日前 replyretweetfavorite