機器學習理論、方法及套用

機器學習理論、方法及套用

《機器學習理論、方法及套用》是2009年科學出版社出版的圖書。該書可供理工科高等院校計算機科學、信息科學、人工智慧和自動化技術及相關專業的教師及研究生閱讀,也可供自然科學和工程技術領域中的研究人員參考。

基本介紹

  • 書名:機器學習理論、方法及套用
  • ISBN:9787030254399
  • 頁數:177頁
  • 出版社:科學出版社
  • 出版時間:2009年8月1日
  • 裝幀:平裝
  • 開本:16
  • 版次:第一版
  • 叢書名:智慧型科學技術著作叢書
  • 正文語種: 簡體中文
內容簡介,目錄,

內容簡介

機器學習的研究不僅是人工智慧領域的核心問題,而且已成為近年來計算機科學與技術領域中最活躍的研究分支之一。《機器學習理論、方法及套用》主要圍繞基於神經網路的學習、強化學習和進化學習三個方面闡述機器學習理論、方法及其套用,共三部分13章。第一部分是神經網路學習及其在複雜非線性系統中的控制,包括基於時間差分的神經網路預測控制,基於徑向基函式網路的機械手疊代學習控制,自適應T_S型模糊徑向基函式網路等。第二部分是強化學習的大規模或連續空間表示問題,包括基於強化學習的白適應PID控制,基於動態回歸網路的強化學習控制,基於自適應模糊徑向基函式網路、支持向量機和高斯過程的連續空間強化學習,基於圖上測地高斯基函式的策略疊代強化學習等。第三部分則是對分布估計最佳化算法進行研究,包括多目標最佳化問題的差分進化一分布估計算法,基於細菌覓食行為的分布估計算法在預測控制中的套用,一種多樣性保持的分布估計算法及其在支持向量機參數選擇問題中的套用等。為便於套用《機器學習理論、方法及套用》闡述的算法,書後附有部分機器學習算法MATLAB源程式。

目錄

《機器學習理論、方法及套用》序
前言
第1章 機器學習概述
1.1 機器學習的概念
1.2 機器學習的發展歷史
1.3 機器學習的分類
1.3.1 基於學習策略的分類
1.3.2 基於學習方法的分類
1.3.3 基於學習方式的分類
1.3.4 基於數據形式的分類
1.3.5 基於學習目標的分類
1.4 機器學習的主要策略
1.4.1 基於神經網路的學習
1.4.2 進化學習
1.4.3 強化學習
1.5 本書主要內容及安排
1.6 本章小結
參考文獻
第2章 基於時間差分的神經網路預測控制
2.1 方法的提出
2.2 基於時間差分的Elman網路預測控制
2.2.1 Elman網路預測模型
2.2.2 反饋校正模型
2.2.3 參考軌跡
2.2.4 滾動最佳化算法
2.3 仿真研究
2.3.1 預測仿真
2.3.2 跟蹤仿真
2.4 本章小結
參考文獻
第3章 基於徑向基函式網路的機械手疊代學習控制
3.1 機械手疊代學習控制
3.2 基於RBF網路的疊代學習控制
3.2.1 選取查詢點的k個最接近樣例
3.2.2 利用RBF網路擬合k個數據點
3.2.3 預測查詢點的控制輸入
3.3 仿真研究
3.4 本章小結
參考文獻
第4章 自適應T-S型模糊徑向基函式網路
4.1 RBF網路和模糊推理系統的功能等價性
4.2 自適應T-S型FRBF網路結構
4.3 自適應T-S型FRBF網路學習
4.3.1 網路學習動態
4.3.2 網路結構學習
4.3.3 網路參數學習
4.3.4 算法步驟
4.4 仿真研究
4.5 本章小結
參考文獻
第5章 基於強化學習的自適應PID控制
5.1 Actor-Critic學習
5.2 基於強化學習的自適應PID控制
5.2.1 基於強化學習的自適應PID控制結構
5.2.2 基於RBF網路的Actor-Critic學習
5.3 控制器設計步驟
5.4 仿真研究
5.5 本章小結
參考文獻
第6章 基於動態回歸網路的強化學習控制
6.1 Q學習
6.2 基於Elman網路的強化學習控制
6.2.1 基於Elman網路的Q學習
6.2.2 Elman網路學習算法
6.2.3 基於Elman網路的Q學習方法步驟
6.3 仿真研究
6.4 本章小結
參考文獻
第7章 基於自適應FRBF網路的強化學習
7.1 基於自適應FRBF網路的Actor-Qitic學習
7.1.1 基於自適應FRBF網路的Actorcritic學習結構
7.1.2 自適應FRBF網路的學習
7.1.3 算法步驟
7.1.4 仿真研究
7.2 基於自適應FRBF網路的Q學習
7.2.1 基於自適應FRBF網路的Q學習結構
7.2.2 自適應FRBF網路的學習
7.2.3 算法步驟
7.2.4 仿真研究
7.3 本章小結
參考文獻
第8章 基於支持向量機的強化學習
8.1 SVM
8.1.1 機器學習
8.1.2 核學習
8.1.3 SVM的思想
8.1.4 SVM的重要概念
8.2 基於SVM的強化學習
8.2.1 基於SVM的Q學習結構
8.2.2 基於滾動時間窗機制的SVM
8.2.3 算法步驟
8.2.4 仿真研究
8.3 基於協同最小二乘SVM的強化學習
8.3.1 基於協同最小二乘SVM的Q學習
8.3.2 LS-SVRM逼近狀態一動作對到值函式的映射關係
8.3.3 LS-SVCM逼近狀態空間到動作空間的映射關係
8.3.4 仿真研究
8.4 本章小結
參考文獻
第9章 基於高斯過程分類器的強化學習
9.1 基於高斯過程分類器的強化學習
9.2 線上高斯過程分類器學習
9.3 算法步驟
9.4 仿真研究
9.5 本章小結
參考文獻
第10章 基於圖上測地高斯基函式的策略疊代強化學習
10.1 環境的圖論描述
10.2 測地高斯基函式
10.3 遞歸最小二乘策略疊代
10.4 算法步驟
10.5 仿真研究
10.6 本章小結
參考文獻
第11章 多目標最佳化問題的差分進化一分布估計算法
11.1 多目標最佳化
11.2 多目標最佳化的差分進化一分布估計算法
11.2.1 多目標最佳化的DE-EDA混合算法步驟
11.2.2 多目標最佳化的DE子代生成策略
11.2.3 多目標最佳化的EDA子代生成策略
11.3 實例研究
11.4 本章小結
參考文獻
第12章 基於細菌覓食行為的分布估計算法在預測控制中的套用
12.1 方法的提出
12.2 基於改進分布估汁算法的預測控制
12.2.1 預測模型
12.2.2 反饋校正模型
12.2.3 基於改進分布估計算法的滾動最佳化
12.3 實驗分析
12.3.1 Benchmark函式實驗
12.3.2 預測控制的曲線跟蹤實驗
12.4 本章小結
參考文獻
第13章 一種多樣性保持的分布估計算法
13.1 混沌模型
13.2 多樣性保持分布估計算法
13.3 Benchmark函式實驗
13.4 在支持向量機參數選擇中的套用
13.4.1 算法步驟
13.4.2 Chebyshev混沌時間序列預測
13.5 本章小結
參考文獻
附錄 部分機器學習算法MATLAB源程式
程式1
第11章 多目標差分進化-分布估計算法MATLAB源程式
程式2
第12章 基於細菌覓食行為的分布估計算法部分MATLAB源程式
程式3
第13章 一種多樣性保持的分布估計算法部分MATLAB程式

相關詞條

熱門詞條

聯絡我們