OpenAI Gym

OpenAI Gym是OpenAI發布的開源強化學習工具包。

基本介紹

外文名：OpenAI Gym
開發者：OpenAI

發展歷史

2016年，OpenAI發布了開源強化學習工具包——OpenAI Gym。

相關詞條

Python強化學習實戰:使用OpenAI Gym,TensorFlow和Keras(2021年清華大...
《Python強化學習實戰：使用OpenAI Gym,TensorFlow和Keras》是2021年清華大學出版社出版的圖書，作者是[美] 托威赫·貝索洛（Taweh Beysolow II）。內容簡介《Python強化學習實戰：使用OpenAI Gym、TensorFlow和Keras》帶領讀者深入強化學習...
Python深度強化學習:基於Chainer和OpenAI Gym
《Python深度強化學習：基於Chainer和OpenAI Gym》是由2021年11月機械工業出版社出版的圖書。作品簡介近年來，機器學習受到了人們的廣泛關注。本書面向普通大眾，指導讀者在Python（基於Chainer和OpenAI Gym）中實踐深度強化學習。讀者只需要...
Python深度強化學習——使用PyTorch, TensorFlow 和OpenAI
3.1OpenAI Gym 3.2動態規劃 3.3策略評估/預測 3.4策略改進和疊代 3.5價值疊代 3.6廣義策略疊代 3.7異步回溯 3.8總結第4章無模型方法 4.1蒙特卡洛估計/預測 4.2蒙特卡洛控制 4.3離線策略MC控制 4.4TD學習方法 4.5TD...
Python強化學習實戰:使用OpenAI Gym,TensorFlow和Keras(清華大學出版...
2.1 OpenAI Gym 15 2.2 基於策略的學習 16 2.3 策略梯度的數學解釋 17 2.4 基於梯度上升的策略最佳化 19 2.5 使用普通策略梯度法求解車桿問題 20 2.6 什麼是折扣獎勵，為什麼要使用它們 23 2.7 策略梯度...
機器學習入門與實戰——Python實踐套用
3.2強化學習的利器——OpenAI Gym 本章參考文獻第三部分機器學習算法與Python實踐篇第4章k近鄰算法 4.1k近鄰算法的原理 4.1.1k近鄰算法的實例解釋 4.1.2k近鄰算法的特點 4.2基於k近鄰算法的算法改進 4.2.1快速KNN算法 4....
深度強化學習(2022年人民郵電出版社出版的圖書)
3.6 實驗環境：OpenAI Gym 42 知識點小結 44 習題 44 第二部分價值學習第4章 DQN與Q學習 48 4.1 DQN 48 4.1.1 概念回顧 48 4.1.2 DQN表達式 49 4.1.3 DQN的梯度 50 4.2 TD算法 50 4.2.1 駕車時間預測示例 ...
生成式深度學習
OpenAI Gym . 256 8.2 世界模型架構 . 257 8.2.1 變分自動編碼器 258 8.2.2 MDN-RNN . 259 8.2.3 控制器 260 8.3 設定 . 261 8.4 訓練過程概述 . 262 8.5 收集隨機rollout 數據 . 263 8.6 訓練VAE 266 ...
Web安全之強化學習與GAN
2.4　OpenAI Gym19 2.5　Keras-rl19 2.6　XGBoost19 2.7　GPU伺服器20 2.8　本章小結23 第3章　性能衡量與集成學習24 3.1　常見性能衡量指標24 3.1.1　測試數據24 3.1.2　混淆矩陣25 3.1.3　準確率與召回率25 3....
TensorFlow機器學習項目開發實戰
14.4　OpenAI Gym 工具包 220 14.5　在 OpenAI Gym 中創建《吃豆人》遊戲 222 14.6　用於深度強化學習的 DQN 224 14.7　將 DQN 套用於遊戲 225 14.8　小結 230 14.9　延伸閱讀 230 第15章　在生產環境中部署機器學習模型...
深度強化學習算法與實踐:基於PyTorch的實現
3.2 OpenAI Gym環境47 3.2.1 Gym環境的安裝和基本接口47 3.2.2 Gym的經典控制環境50 3.2.3 Gym的Atari強化學習環境53 3.2.4 Gym的MuJoCo環境55 3.2.5 自定義Gym強化學習環境57 3.3 DeepMind Lab強化...

熱門詞條

聯絡我們