TF-Agents 0.4 Tutorials : Checkpointer と PolicySaver (翻訳/解説)

【TF-Agents Tutorials (10) Checkpointer と PolicySaver】
今回は Checkpointer と PolicySaver のチュートリアルです。Checkpointer は訓練/ポリシー状態と再生バッファ状態をローカルにセーブして (後で) ロードできるユティリティです。PolicySaver はポリシーだけをセーブ/ロードするツールで Checkpointer よりも軽く、ポリシーを作成したコードの知識がなくてもモデルを配備するために PolicySaver を利用できます。
TF-Agents は TensorFlow の強化学習のためのライブラリです。4 月に 0.4.0 ステーブル版がリリースされましたのでチュートリアルを翻訳しています。
TF-Agents は DQN エージェントを訓練するために必要な総てのコンポーネントを提供します。TF-Agents は十分にテストされたモジュール・コンポーネントを提供することにより、新しい RL アルゴリズムを設計・実装してテストすることを容易にします。