ε-δ論法,ε-N論法を含めた数学的コンテンツの可視化とアプリケーション開発のブログ
読者です 読者をやめる 読者になる 読者になる

Hello Dream World

作ったもの,感じた事をつらつらと。。。

ブロック崩しを攻略する人工知能の制作に関する報告 2

プログラミング

メモ

前回ニューラルネットワークに問題があったのでニューラルネットワーク勉強をした。そのあとNANDゲートの実装に成功したので,ニューラルネットワークブロック崩しに応用した。その結果がこれです。

学習してくれたことが何よりの喜び!!

 

課題

学習するたび良くなるわけでもなく,かなり不安定。この動画の後も,まったくボールを追いかけなくなったりしました。考えられる原因は

・学習の振動

だと思います(専門家でもないので言葉は違うかもしれません)。

検証方法が分からないのでいきずまりです。

 

検証方法を知るためにできることは,ニューラルネットワークとQ-learningの組み合わせの実装を調べて理解することだと思います。今作っている人工知能同様に私の頭も学習手段を獲得するまで時間がかかりそうです。

 

参考資料

本家googleの論文

http://www.cs.toronto.edu/~vmnih/docs/dqn.pdf

Human-level control through deep reinforcement learning | ReadCube Articles