TF-Agents 0.4 Tutorials : ポリシー (翻訳/解説)

【TF-Agents Tutorials (3) ポリシー】
今回はポリシーのチュートリアルです。強化学習の用語では、ポリシーは環境からの観測をアクションかアクションに渡る分布にマップします。
TF-Agents は TensorFlow の強化学習のためのライブラリです。4 月に 0.4.0 ステーブル版がリリースされましたのでチュートリアルを翻訳しています。
TF-Agents は DQN エージェントを訓練するために必要な総てのコンポーネントを提供します。TF-Agents は十分にテストされたモジュール・コンポーネントを提供することにより、新しい RL アルゴリズムを設計・実装してテストすることを容易にします。コンポーネントは Python 関数または TensorFlow グラフ ops として実装されていてそれらの間で変換するためのラッパーも持ちます。