動手學強化學習

內容簡介

本書系統地介紹了強化學習的原理和實現，是一本理論紮實、落地性強的圖書。

本書包含3個部分：第一部分為強化學習基礎，講解強化學習的基礎概念和表格型強化學習方法；第二部分為強化學習進階，討論深度強化學習的思維方式、深度價值函式和深度策略學習方法；第三部分為強化學習前沿，介紹學術界在深度強化學習領域的主要關注方向和前沿算法。同時，本書提供配套的線上代碼實踐平台，展示源碼的編寫和運行過程，讓讀者進一步掌握強化學習算法的運行機制。

本書理論與實踐並重，在介紹強化學習理論的同時，輔之以線上代碼實踐平台，幫助讀者通過實踐加深對理論的理解。本書適合對強化學習感興趣的高校學生、教師，以及相關行業的開發和研究人員閱讀、實踐。

圖書目錄

第一部分強化學習基礎

第 1 章初探強化學習 ......................2

1.1 簡介.................................................2

1.2 什麼是強化學習..................................2

1.3 強化學習的環境..................................4

1.4 強化學習的目標..................................4

1.5 強化學習中的數據...............................5

1.6 強化學習的獨特性...............................6

1.7 小結.................................................6

第 2 章多臂老虎機問題......................7

2.1 簡介.................................................7

2.2 問題介紹 ..........................................7

2.2.1 問題定義.......................................7

2.2.2 形式化描述...................................8

2.2.3 累積懊悔 ......................................8

2.2.4 估計期望獎勵 ...............................8

2.3 探索與利用的平衡 ............................ 10

動手學強化學習

基本介紹

內容簡介

圖書目錄

作者簡介

相關詞條

熱門詞條