TF-Agents 0.4 Tutorials : 再生バッファ (翻訳/解説)
【TF-Agents Tutorials (5) 再生バッファ】
今回は再生バッファのチュートリアルです。強化学習アルゴリズムは環境でポリシーを実行するときその軌跡をストアするために再生バッファを利用します。訓練の間、エージェントの経験を「再生する」ために再生バッファに問合せが行なわれます。
TF-Agents は TensorFlow の強化学習のためのライブラリです。4 月に 0.4.0 ステーブル版がリリースされましたのでチュートリアルを翻訳しています。
TF-Agents は DQN エージェントを訓練するために必要な総てのコンポーネントを提供します。TF-Agents は十分にテストされたモジュール・コンポーネントを提供することにより、新しい RL アルゴリズムを設計・実装してテストすることを容易にします。