PyTorch 1.5 Tutorials : 強化学習 : 強化学習 (DQN) チュートリアル (翻訳/解説)

【PyTorch 1.5 Tutorials : 強化学習 : DQN チュートリアル】
今回は「強化学習」カテゴリーから DQN (深層 Q-ネットワーク) のチュートリアルです。題材は標準的な OpenAI Gym のカートポールですが、スクリーンを読み取って入力とする CNN を利用したアプローチで実装しています。最初に再生メモリと DQN アルゴリズムについて簡単に説明された後、Q ネットワークを実装して訓練します。Epsilon-Greedy ポリシーを使用しています。
PyTorch は TensorFlow とともにポピュラーな深層学習フレームワークです。PyTorch 1.5 が 4 月にリリースされてドキュメントも再構成されていますので再翻訳しています。
チュートリアルは「PyTorch の学習」「画像/ビデオ」「音声」「テキスト」「強化学習」等のカテゴリーに分かれています。
人工知能研究開発支援