以下の内容はhttps://paper.hatenadiary.jp/entry/2016/12/28/110230より取得しました。


メモ:Value Iteration Networksのtheano, tensor-flow, chainerでの実装

NIPS-16のBest Paper AwardであるTamar, Aviv, Sergey Levine, and Pieter Abbeel. "Value Iteration Networks." arXiv preprint arXiv:1602.02867 (2016).のtensor-flowでの実装が公開されました。

概要

エージェントが決められたマップのスタートとゴールの間から、その最短パスを見つける強化学習にありがちな問題設定...とか書いてたらQiitaの記事を見つけたのでそっちに任せます。

実装

theano

作者さまの実装です。

tensor-flow

chainer

Qiitaを書いた記事の方の実装。




以上の内容はhttps://paper.hatenadiary.jp/entry/2016/12/28/110230より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14