Keras 2 : examples : 強化学習 – Proximal ポリシー最適化 (PPO) (翻訳/解説)
【Keras 2 : 強化学習 – Proximal ポリシー最適化 (PPO)】
Keras Web サイトのドキュメントの翻訳を進めています。
今回は Code examples の「強化学習」から「Proximal ポリシー最適 (PPO)」です。このノートブックは CartPole-v0 環境のための Proximal ポリシー最適化エージェントの実装を実演します。 [More]