強化学習

TensorFlow
TensorFlow TFRT 新しい TensorFlow ランタイム (翻訳/解説)

【TensorFlow TFRT : 新しい TensorFlow ランタイム】 TensorFlow TFRT は先週公開されたばかりの新しい TensorFlow ランタイムです。プロジェクトは早期ステージにあります […]

続きを読む
TensorFlow
TF-Agents 0.4 Tutorials : Checkpointer と PolicySaver (翻訳/解説)

【TF-Agents Tutorials (10) Checkpointer と PolicySaver】 今回は Checkpointer と PolicySaver のチュートリアルです。Checkpointer は […]

続きを読む
TensorFlow
TF-Agents 0.4 Tutorials : DQN C51/Rainbow (翻訳/解説)

【TF-Agents Tutorials (9) DQN C51/Rainbow】 今回は DQN C51/Rainbow のチュートリアルです。カテゴリカル DQN (C51) エージェントをカートポール環境上、 TF […]

続きを読む
TensorFlow
TF-Agents 0.4 Tutorials : ネットワーク (翻訳/解説)

【TF-Agents Tutorials (8) ネットワーク】 今回はエージェントのネットワークのチュートリアルです。貴方のエージェントのためにどのようにカスタム・ネットワークを定義するかを説明します。 TF-Agen […]

続きを読む
TensorFlow
TF-Agents 0.4 Tutorials : SAC minitaur (翻訳/解説)

【TF-Agents Tutorials (7) SAC minitaur】 今回は SAC minitaur のチュートリアルです。このサンプルは TF-Agents ライブラリを使用して Minitaur 環境上で […]

続きを読む