Acme : サンプル : チュートリアル (翻訳/解説)
【Acme : チュートリアル】
今回はサンプルからチュートリアルです。強化学習エージェントを作成するために Acme のモジュールがどのようにスタックされるかの概要を提供します。どのようにネットワークを環境仕様に適合させるか、アクター、leaner、再生バッファ、データセット、adder そして完全なエージェントをどのように作成するかを示します。
Acme は DeepMind 社が新たに公開した、TensorFlow 上に構築された強化学習 (RL) エージェントとエージェント・ビルディングブロックのライブラリです。ドキュメントは順次拡充されている段階ですが、幾つか翻訳しています。
Acme は新規の研究を行なうために十分な柔軟性を提供しながら、ポピュラーなアルゴリズムの参照実装として、そして強力なベースラインとして役立つような単純で効率的で可読なエージェントを公開するための努力が成されています。
人工知能研究開発支援