PyTorch 1.4 Tutorials : 強化学習 : 強化学習 (DQN) チュートリアル (翻訳/解説)
【PyTorch 1.4 Tutorials : 強化学習
◆ 強化学習 (DQN) チュートリアル
PyTorch は TensorFlow とともに多く利用されている深層学習フレームワークです。1.4 がリリースされましたので、1.4 ドキュメントをベースに翻訳を進めます。
今回は「強化学習」カテゴリーから DQN (深層 Q-ネットワーク) のチュートリアルです。題材は標準的な OpenAI Gym のカートポールですが、スクリーンを読み取って入力とする CNN を利用したアプローチで実装してみます。最初に再生メモリと DQN アルゴリズムについて簡単に説明された後、Q ネットワークを実装して訓練します。Epsilon-Greedy ポリシーを使用しています。
チュートリアルは「Getting Started」「画像」「音声」「テキスト」「強化学習」「分散訓練」等々のカテゴリーに分かれています。