AlphaGoの衝撃再び!「自己学習」で神の領域へ

アルファ碁を開発したDeep Mind社が「人間の棋譜を使わず自己学習したAlphaGo Zeroが従来のAlphaGoに圧勝」という衝撃的な論文を発表しました。自己学習の他にpolicy/value netの統合、ResNet化やモンテカルロ木探索でplayout廃止と革新的な進化を遂げておりその内容を解説します。