OpenAI Gym是OpenAI發布的開源強化學習工具包。
基本介紹
- 外文名:OpenAI Gym
- 開發者:OpenAI
OpenAI Gym是OpenAI發布的開源強化學習工具包。
《Python強化學習實戰:使用OpenAI Gym,TensorFlow和Keras》是2021年清華大學出版社出版的圖書,作者是[美] 托威赫·貝索洛(Taweh Beysolow II)。內容簡介 《Python強化學習實戰:使用OpenAI Gym、TensorFlow和Keras》帶領讀者深入強化學習...
《Python深度強化學習:基於Chainer和OpenAI Gym》是由2021年11月機械工業出版社出版的圖書。作品簡介 近年來,機器學習受到了人們的廣泛關注。本書面向普通大眾,指導讀者在Python(基於Chainer和OpenAI Gym)中實踐深度強化學習。讀者只需要...
3.1OpenAI Gym 3.2動態規劃 3.3策略評估/預測 3.4策略改進和疊代 3.5價值疊代 3.6廣義策略疊代 3.7異步回溯 3.8總結 第4章無模型方法 4.1蒙特卡洛估計/預測 4.2蒙特卡洛控制 4.3離線策略MC控制 4.4TD學習方法 4.5TD...
2.1 OpenAI Gym 15 2.2 基於策略的學習 16 2.3 策略梯度的數學解釋 17 2.4 基於梯度上升的策略最佳化 19 2.5 使用普通策略梯度法求解車桿問題 20 2.6 什麼是折扣獎勵,為什麼要使用它們 23 2.7 策略梯度...
3.2強化學習的利器——OpenAI Gym 本章參考文獻 第三部分機器學習算法與Python實踐篇 第4章k近鄰算法 4.1k近鄰算法的原理 4.1.1k近鄰算法的實例解釋 4.1.2k近鄰算法的特點 4.2基於k近鄰算法的算法改進 4.2.1快速KNN算法 4....
3.6 實驗環境:OpenAI Gym 42 知識點小結 44 習題 44 第二部分 價值學習 第4章 DQN與Q學習 48 4.1 DQN 48 4.1.1 概念回顧 48 4.1.2 DQN表達式 49 4.1.3 DQN的梯度 50 4.2 TD算法 50 4.2.1 駕車時間預測示例 ...
OpenAI Gym . 256 8.2 世界模型架構 . 257 8.2.1 變分自動編碼器 258 8.2.2 MDN-RNN . 259 8.2.3 控制器 260 8.3 設定 . 261 8.4 訓練過程概述 . 262 8.5 收集隨機rollout 數據 . 263 8.6 訓練VAE 266 ...
2.4 OpenAI Gym19 2.5 Keras-rl19 2.6 XGBoost19 2.7 GPU伺服器20 2.8 本章小結23 第3章 性能衡量與集成學習24 3.1 常見性能衡量指標24 3.1.1 測試數據24 3.1.2 混淆矩陣25 3.1.3 準確率與召回率25 3....
14.4 OpenAI Gym 工具包 220 14.5 在 OpenAI Gym 中創建《吃豆人》遊戲 222 14.6 用於深度強化學習的 DQN 224 14.7 將 DQN 套用於遊戲 225 14.8 小結 230 14.9 延伸閱讀 230 第15章 在生產環境中部署機器學習模型...
3.2 OpenAI Gym環境47 3.2.1 Gym環境的安裝和基本接口47 3.2.2 Gym的經典控制環境50 3.2.3 Gym的Atari強化學習環境53 3.2.4 Gym的MuJoCo環境55 3.2.5 自定義Gym強化學習環境57 3.3 DeepMind Lab強化...