著者は2017年電王戦で佐藤名人を破った将棋プログラム「ポナンザ」の作者 山本氏です。
1997年に世界チャンピオンを破ったチェスと比べ将棋・囲碁はコンピュータには難しいと言われていましたが機械学習、強化学習をうまく使うことで想像を超えるスピードで進化を遂げ
- 将棋:将棋電王戦FINAL(2015年)はプロ棋士が3勝2敗で勝ち越したものの、2016年、2017年の電王戦ではポナンザが山崎隆之 叡王、佐藤 天彦 叡王にそれぞれ2連勝
- 囲碁:アルファ碁が2016年に李 世乭九段、2017年に柯潔九段に勝利
といったニュースが大きな話題になりました。私もボードゲームのAIを作ったりしていましたがまさかこんなに早く囲碁・将棋でプログラムが世界チャンピオンに勝つ日が来るとは思っていませんでした。いい時代に生まれたなぁとしみじみ思います。
さて、本書の前半はポナンザの開発者としてコンピュータ将棋の最先端を引っ張ってきた山本氏がコンピュータ将棋における
- 機械学習による将棋の評価関数の自動チューニング
- 強化学習によるさらなる評価関数のチューンアップ
- ディープラーニングの導入
やコンピュータ囲碁の
- 囲碁におけるモンテカルロ法の導入
- ディープラーニング&強化学習による勝率予想
などのブレイクスルーとなった技術のエッセンスを解説しています。開発時の経験談・苦労談を織り交ぜつつ、今まで不可能と思われていた囲碁・将棋の正確な局面評価がなぜ可能になったかを分かりやすくまとめられています。
成功事例の「うまくいったきれいな部分」だけ見ると夢のような世界ですが、人工知能の分野では「黒魔術[1]なぜうまくいくのかの理屈、理由が分からない技術のこと」の影響力が大きくなっているそうで、開発者である山本氏でもポナンザがうまくいった理由が分からない部分が多いそうです。実際、何らかの変更が「黒魔術」の場合その効果を計るために
- 変更前後のバージョンで3,000試合自動対戦
- 変更後の勝率が52%以上なら採用
としているそうです。3,000試合はかなり多い気もしましたが、多少変更をしたくらいでは勝率はほとんど変わらず勝率52%程度でも有意な差と言うためにこれくらいの試合数が必要になるんですね。それでも変更が採用されるのは50回に1回程度だそうで、ポナンザのような強いアルゴリズムは気の遠くなるような努力(とマシンリソース)の賜物なんだと思います。
後半は知能、知性とは何か?という問いに対する山本氏なりの見解が綴られており、これからの人工知能の進化、人間との関係についての示唆に富んだ内容で読み応えがあります。さらに巻末付録ではアルファ碁と李 世乭九段の世紀の一戦について山本氏と囲碁棋士の大橋六段との対談が収録されています。お二人のかなり率直な意見&ツッコミが繰り広げられており面白いやり取りになっています。例えば、対談の中で山本氏は
将棋はすでにほかの方法で強くなっているから、わざわざディープラーニングをやらなくてもいいと思う。
と発言[2]注釈にもある通りその数ヶ月後にディープラーニングを採用しておりここでも進歩の速さが伺えますしていたり、大橋六段の
囲碁の布石はデータじゃなくて、思想とかで考えるものだったんですよ。(中略)アルファ碁が強すぎるからです。終盤の構想がはじめからできてて、そのために序盤をやっているようにすら見える。(中略)ぼくは、序盤、中盤、終盤だったら、アルファ碁は序盤が一番強いと思った。
というコメントを見ると、コンピュータといえば終盤が強いイメージがありますが自ら知識を獲得したアルファ碁はむしろ序盤の構想がぬきんでて優秀なんだということが分かります。
全体を通して細かな定義や数式は使わず概念図を多用して感覚的に分かりやすい説明になっており、機械学習、強化学習になじみのない人でもコンピュータ将棋・囲碁の最前線を理解できる良書だと思います。