分層強化學習理論與方法

分層強化學習理論與方法

《分層強化學習理論與方法》是2007年哈爾濱工業大學出版社出版的圖書,作者是沈晶。

基本介紹

  • 書名:分層強化學習理論與方法
  • 作者:沈晶
  • 出版社:哈爾濱工業大學出版社
  • 出版時間:2007-12-01
基本信息,內容簡介,目錄,

基本信息

作 者:沈晶 著叢 書 名:出:哈爾濱工業大學出版社ISBN:9787811330281出版時間:2007-12-01版 次:1頁 數:141裝 幀:平裝開 本:16開所屬分類:圖書 > 計算機與網際網路 > 計算機理論、基礎知識
分層強化學習理論與方法

內容簡介

強化學習通過試錯與環境互動獲得策略的改進,其自學習和線上學習的特點使其成為機器學習研究的一個重要分支。但是,強化學習一直被維數災難所困擾,近年來,分層強化學習在克服維數災難方面取得了顯著進展。《分層強化學習理論與方法》系統地介紹了強化學習、分層強化學習的理論基礎和學習算法以及作者在分層強化學習領域的研究成果和該領域的最新研究進展。
《分層強化學習理論與方法》可作為高等院校和科研機構從事計算機套用、人工智慧和機器學習等相關專業和方向的教師、研究人員、研究生及高年級本科生參考使用。

目錄

第1章 緒論
1.1 機器學習
1.1.1 機器學習的定義
1.1.2 機器學習的發展史
1.1.3 機器學習系統的基本模型
1.1.4 機器學習的主要策略
1.2 強化學習
1.2.1 強化學習的定義
1.2.2 強化學習的發展史
1.3 分層強化學習
1.3.1 分層強化學習的定義
1.3.2 研究現狀與發展趨勢
第2章 強化學習
2.1 強化學習的基本原理
2.2 強化學習的基本方法
2.3 部分可觀測馬氏過程
第3章 分層強化學習
3.1 半馬氏過程
3.2 分層與抽象
3.3 典型分層強化學習方法
3.3.1 Option分層強化學習方法
3.3.2 HAM分層強化學習方法
3.3.3 MAXQ分層強化學習方法
3.3.4 典型分層強化學習方法的比較分析
3.4 OMQ分層強化學習方法
3.4.1 測試用例描述
3.4.2 OMQ理論框架
3.4.3 OMQ學習算法
3.4.4 OMQ學習算法最優性分析
3.4.5 OMQ學習算法收斂性證明
3.4.6 OMQ學習算法實驗分析
第4章 動態分層強化學習
4.1 學習任務的自動分層
4.1.1 瓶頸和路標狀態法
4.1.2 共用子空間法
4.1.3 多維狀態法
4.1.4 馬氏空間法
4.1.5 其他有關方法
4.1.6 任務自動分層方法評價
4.2 基於免疫聚類的自動分層算法
4.2.1 免疫原理剖析
4.2.2 基於免疫聚類的Option自動生成算法
4.3 基於二次應答機制的動態分層算法
4.3.1 算法描述
4.3.2 實驗分析
4.4 未知動態環境中的分層強化學習方法
4.4.1 移動機器人路徑規劃問題
4.4.2 未知動態環境中的OMQ分層強化學習算法
4.4.3 實驗分析
……
第5章 多智慧型體分層強化學習
參考文獻

相關詞條

熱門詞條

聯絡我們