Masassiah Blog

現役サラリーマンのスキルアップのための読書まとめ

人工知能はどのようにして「名人」を超えたのか?――最強の将棋 AI ポナンザの開発者が教える機械学習・深層学習・強化学習の本質

人工知能はどのようにして「名人」を超えたのか?――最強の将棋 AI ポナンザの開発者が教える機械学習・深層学習・強化学習の本質』(山本一成,ダイヤモンド社,2017年5月10日)を読了。

人間は物事を見続けているなかで,適切な一般化や隠れているノウハウを発見するのが得意です。(p. 60)

適切な一般化や隠れたノウハウを発見するのが,苦手な人間もいる。

結果として将棋プログラマの主な仕事は,いかに上手に将棋プログラムを機械学習させるようにするかということになっています。いわば勉強そのものでなく,勉強の仕方を教えるようなものです。(p. 76)

将棋以外の分野でも,機械学習させることが,プログラマの仕事になりつつあるか。

ここからは完全に私の想像ですが,さらに議論を進めると,もしかしたら「知能とは画像である」と言うことすらできるかもしれません。

考えてみれば,私たちがふだん脳内で見ているのは,3 次元を 2 次元にした画像だと言うことができます。逆に,1 次元の数字の列をわざわざ手間をかけて 2 次元の画像(グラフ)にして解釈したりもします。(pp. 106 - 107)

2 次元の画像で捉えることは,コンピュータに近い捉え方なのか。

ポイントは,「教師あり学習」がその名のとおり,お手本となる教師を必要とするのに対し,「強化学習」は教師を必要としないということです。強化学習では,未知の環境があってもコンピュータが投機的に調べて,結果をフィードバックすることで学習していくのです。

フィードバックを繰り返すことによって「評価」が "強化" されるから,強化学習と言うんですね。(p. 124)

お手本となる教師データが少なければ,強化学習ができないか検討してみる。

人工知能の開発においては,必ず大量のデータが必要になるのです。そのうえで,最初は「教師あり学習」。そしてその後は「強化学習」に移るはずです。この流れは今後人工知能が普及するなか,さまざまな場面で出てくると思います。ぜひ覚えておいてください。(p. 130)

教師あり学習強化学習を使い分けられるようにする。

ちなみに,数学では鮮やかな解放のことを「エレガントな解放」といいます。一方,モンテカルロ法のようにコンピュータを使う力まかせの解法を「エレファントな解法」と言ったりします。ゾウのように力強い解法ということですね。(p. 144)

エレファントな解法という言葉は初めて知った。