以下の内容はhttps://yamaimo.hatenablog.jp/entry/2015/10/26/200000より取得しました。


「BirdHead」の思考ルーチンを作ってみた。(まとめ)

これまでの各記事は以下から。

強化学習の手法として使ったSarsa( \lambda)法、関数近似については、まだ記事を書いていないので、そのうち書いたらリンクを・・・

強化学習自体については、以下の一連の記事を参照。

特に、Sarsa( \lambda)法と関連の深い、モンテカルロ法(方策オン型モンテカルロ制御)、Sarsa法については、以下を参照。

これで思考ルーチンも合わせてモデルの部分はほぼ完成なので、次はUIを作っていく予定。

今日はここまで!




以上の内容はhttps://yamaimo.hatenablog.jp/entry/2015/10/26/200000より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14