ブロック崩しを攻略する人工知能の制作に関する報告 2
メモ
前回ニューラルネットワークに問題があったのでニューラルネットワークの勉強をした。そのあとNANDゲートの実装に成功したので,ニューラルネットワークをブロック崩しに応用した。その結果がこれです。
学習してくれたことが何よりの喜び!!
課題
学習するたび良くなるわけでもなく,かなり不安定。この動画の後も,まったくボールを追いかけなくなったりしました。考えられる原因は
・学習の振動
だと思います(専門家でもないので言葉は違うかもしれません)。
検証方法が分からないのでいきずまりです。
検証方法を知るためにできることは,ニューラルネットワークとQ-learningの組み合わせの実装を調べて理解することだと思います。今作っている人工知能同様に私の頭も学習手段を獲得するまで時間がかかりそうです。
参考資料
本家googleの論文
http://www.cs.toronto.edu/~vmnih/docs/dqn.pdf
Human-level control through deep reinforcement learning | ReadCube Articles