TensorFlow : Dopamine 概要 (翻訳/解説)
【TensorFlow : Dopamine 概要】
Dopamine は 8月27日に Google 社から公開された TensorFlow ベースの強化学習フレームワークです。強化学習アルゴリズムの高速プロトタイピングのための研究用フレームワークで、DQN はもちろん先端技術の Rainbow エージェントの実装も含まれています。
先に、インストール手順やパラメータ調整方法が説明された github レポジトリの README を翻訳しましたが、次に概要ドキュメントを翻訳しました。
本ドキュメントでは主として Dopamine エージェントの拡張方法を扱います。Dopamine はアルゴリズム的な研究の単純化を目指して設計されているためにエージェントも容易に拡張可能です。ファイル構成・エージェントの構成・チェックポイント及びロギングについて説明された後、DQN, Rainbow, C51 そして IQN それぞれのエージェントについて具体的な変更・拡張方法が解説されます。