《大規模強化學習》是2016年科學出版社出版的圖書,作者是劉全。
基本介紹
- 書名:大規模強化學習
- 作者:劉全
- 出版社:科學出版社
- ISBN:9787030477477
內容簡介,圖書目錄,
內容簡介
該書討論大規模強化學習的理論及方法,介紹強化學習在大狀態再檔葛記空間任務中的套用。該研戒判籃究已成為近年來計算機科學與技術領域最活躍的研究分支之一。 全書共分六部分 21 章。全催第一部分是強化學習基礎。第二部分是用於強化學習的值函式逼近方法。第三部分是最小二乘策略疊代方法。第四部分是模糊近似強化學習方法。第五部分是並行強化學習方法。第六部分是離策略強化學習方法。
圖書目錄
前言
第1章強化學習概述
第2章大規模或連採恥棄續狀態空間的強化學習
第3章梯度下降值函式逼近模型的改進
第4章基於LSSVR的Q-值函式分片逼近模型
第5章基於ANRBF網路的Q-V值函式協同逼近模型
第6章基於高斯過程的快速Sarsa算法
第7章基於高斯過程的Q學習算法
第8章最小二乘策略疊代算法
第9章批量最小二乘策略疊代算法
第10章自動批量最小二乘策略疊代算法
第11章連續動作空間紙祖犁嘗的批量最小二乘策略疊代算法
第12章一種基於雙層模糊推理的Sarsa(λ)算法
第13章一種基於區間型二型模糊推理的Sarsa(λ)算法
第14章一種帶有自適應基函式的模糊值疊代算法
第15章基於狀態空間分解和智慧型調度的並行強化學習
第16章基於資格跡的並行時間信度分配強化學習算肯祝記法
第17章基於並行採樣和學習經驗復用的E<sup>3</sup>榜獄乎算法
第18章基於線性函式逼近的離策略Q(λ)算法
第19章基於二階TD Error的Q(λ)算法
第20章基於值函式遷移的快速Q-Learning算法
第21章離策略帶參貝葉斯強化學習算法