PyTorch : Tutorial 中級 : 強化学習 (DQN) チュートリアル (翻訳/解説)
【PyTorch Tutorial 中級: 強化学習 (DQN) チュートリアル】
PyTorch の中級チュートリアルを翻訳しています。最新の PyTorch 0.4.0 リリースにも対応しています。
今回のテーマは強化学習で DQN (深層 Q-ネットワーク) を扱います。
題材は定番の OpenAI Gym のカートポールですが、そのままでは簡単過ぎるのでスクリーンを読み取って入力とする CNN アプローチで実装してみます。
最初に Replay Memory と DQN アルゴリズムが簡単に説明された後、Q ネットワークを実装して訓練します。基本的な Epsilon-Greedy ポリシーを使用しています。