《多智慧型體系統及套用(卷二)》是2018年清華大學出版社出版的圖書,作者是王崇駿、史忠植、常亮、王文劍。
基本介紹
- 書名:多智慧型體系統及套用(卷二)
- 作者:王崇駿、史忠植、常亮、王文劍
- ISBN:9787302487777
- 定價:58元
- 出版時間:2018.01.01
- 印刷日期:2017.12.20
內容簡介,目錄,
內容簡介
智慧型體與多智慧型體系統是人工智慧領域活躍的研究分支,其涉及的基本研究問題包括合作協調、推理規劃、學習、工具框架、模型等。本書的內容遴選自2015年及2016年度“中國智慧型體及多智慧型體系統”研討會的特邀報告,同時收集了部分學者的最新研究進展。
目錄
1概述
2動機理論
3動機學習
4基於動機的強化學習
5小結
參考文獻
專題2多智慧型體強化學習中的博弈、均衡和知識遷移胡裕靖,高陽
1緒論
2背景知識
3不共享值函式的多智慧型體強化學習
4基於均衡遷移的多智慧型體強化學習
5稀疏互動的多智慧型體系統中的知識遷移和博弈約簡
6小結
參考文獻
專題3一種基於中介agent的強化學習最佳化協商方法陳利紅,董紅斌
1引言
2基於強化學習的雙邊多議題最佳化協商模型
3基於中介agent自適應學習的協調協商
4實驗設計與分析
5小結
參考文獻
專題4多智慧型體協調技術綜述郝建業
1引言
2固定對手重複博弈
3合作式群體博弈
4非合作式群體博弈
5小結
參考文獻
專題5基於決策理論的多智慧型體規劃吳鋒
1引言
2分散式局部可觀察馬爾可夫決策過程(DECPOMDP)
3DECPOMDP的離線規划算法
4DECPOMDP的線上規划算法
5小結
參考文獻
目錄多智慧型體系統及套用(卷二)專題6部分可觀察環境中的序貫決策理論及方法研究章宗長
1引言
2部分可觀察馬爾可夫決策過程
3離線規劃方法
4線上規劃方法
5基於覆蓋數的規劃理論
6小結
參考文獻
專題7基於Landmark的啟發式搜尋規劃張雷,吳駿,王崇駿
1引言
2STRIPS規劃問題
3STRIPS問題的啟發式函式設計
4多值Landmark規劃
5小結
參考文獻
專題8AutoRobot:基於多主體系統的自主機器人軟體框架
毛新軍,楊碩,楊森
1引言
2自主機器人及其軟體特點
3機器人軟體技術分析
4基於多主體系統的自主機器人軟體體系結構
5自主機器人軟體框架AutoRobot
6案例分析
7小結
參考文獻專題9計算經濟學與最優機制設計問題唐平中
1計算經濟學簡介
2最優機制設計問題:單件商品
3最優機制設計:多件商品
4小結
參考文獻
專題10基於計算博弈論的計程車服務定價研究甘家瑞,安波
1研究背景與相關工作
2博弈建模
3模型求解——緊湊表達法
4ASM算法——基於元時間表的緊湊表達
5解決任意約束下的問題
6實驗
7小結
參考文獻
專題11雲計算中定價機制的研究秦濤
1雲計算簡介
2雲計算中的定價模型
3市場競爭、演變與定價策略最佳化
4小結
參考文獻
2動機理論
3動機學習
4基於動機的強化學習
5小結
參考文獻
專題2多智慧型體強化學習中的博弈、均衡和知識遷移胡裕靖,高陽
1緒論
2背景知識
3不共享值函式的多智慧型體強化學習
4基於均衡遷移的多智慧型體強化學習
5稀疏互動的多智慧型體系統中的知識遷移和博弈約簡
6小結
參考文獻
專題3一種基於中介agent的強化學習最佳化協商方法陳利紅,董紅斌
1引言
2基於強化學習的雙邊多議題最佳化協商模型
3基於中介agent自適應學習的協調協商
4實驗設計與分析
5小結
參考文獻
專題4多智慧型體協調技術綜述郝建業
1引言
2固定對手重複博弈
3合作式群體博弈
4非合作式群體博弈
5小結
參考文獻
專題5基於決策理論的多智慧型體規劃吳鋒
1引言
2分散式局部可觀察馬爾可夫決策過程(DECPOMDP)
3DECPOMDP的離線規划算法
4DECPOMDP的線上規划算法
5小結
參考文獻
目錄多智慧型體系統及套用(卷二)專題6部分可觀察環境中的序貫決策理論及方法研究章宗長
1引言
2部分可觀察馬爾可夫決策過程
3離線規劃方法
4線上規劃方法
5基於覆蓋數的規劃理論
6小結
參考文獻
專題7基於Landmark的啟發式搜尋規劃張雷,吳駿,王崇駿
1引言
2STRIPS規劃問題
3STRIPS問題的啟發式函式設計
4多值Landmark規劃
5小結
參考文獻
專題8AutoRobot:基於多主體系統的自主機器人軟體框架
毛新軍,楊碩,楊森
1引言
2自主機器人及其軟體特點
3機器人軟體技術分析
4基於多主體系統的自主機器人軟體體系結構
5自主機器人軟體框架AutoRobot
6案例分析
7小結
參考文獻專題9計算經濟學與最優機制設計問題唐平中
1計算經濟學簡介
2最優機制設計問題:單件商品
3最優機制設計:多件商品
4小結
參考文獻
專題10基於計算博弈論的計程車服務定價研究甘家瑞,安波
1研究背景與相關工作
2博弈建模
3模型求解——緊湊表達法
4ASM算法——基於元時間表的緊湊表達
5解決任意約束下的問題
6實驗
7小結
參考文獻
專題11雲計算中定價機制的研究秦濤
1雲計算簡介
2雲計算中的定價模型
3市場競爭、演變與定價策略最佳化
4小結
參考文獻