內容簡介
本書對人工智慧學科及其研究領域進行抽象,梳理出一個人工智慧的研究體系,然後再按照這個體系講述其原理,再穿插一些實例。全書分為五篇、共十四章。這五篇分別是人工智慧的體系、求解、規劃、學習、以及推理。 體系篇中有兩章,即緒論與體系論。其次,求解篇分成四章,講述搜尋問題、最佳化問題、博弈問題、以及約束問題求解。第三,規劃篇中有兩章,分別是時空關聯規劃和決策理論規劃。第四,是學習篇,論述機器學習的三個視角、然後再用三章分別講述學習的任務、範式、以及框架。最後是推理篇,用兩章分別介紹知識表示和推理機制。 本書可作為人工智慧、計算機及其相關專業的高年級本科生或研究生的教材,也可作為人工智慧的參考書,供有關教學和科研人員使用。
作者簡介
王文敏於1989年3月獲得哈爾濱工業大學計算機博士學位。畢業後任哈爾濱理工大學副教授、哈爾濱工業大學副教授等。1992年出國並在日美知名公司擔任主任研究員、主幹研究員、中國區總工、研發部部長等。2009年底應邀回國,任北京大學深圳研究生院教授、北京大學數字視頻編解碼國家工程實驗室廣州研發中心副主任。2011年6月任華南理工大學教授。2012年3月任北京大學信息工程學院常務副院長(主持工作)、2013年9月至2016年3月任北京大學信息工程學院院長。2017年6月起任深圳市智慧型多媒體與虛擬現實重點實驗室主任。2019年起,任澳門科技大學教授。
自2017年3月起,先後在北大華文慕課、中國大學MOOC、北京高校優質課程研究會、清華大學學堂線上共4家大規模開放式線上課程平台上開設《人工智慧原理》課程。截止至2019年4月,該課程選課人數累計超過19餘萬人,並被認定為中國教育部2018年“國家精品線上開放課程”。
圖書目錄
前言
致謝
第一篇 體系
第1章 緒論
1.1 引言
1.2 關於Agent的翻譯
1.3 人工智慧的定義
1.4 人工智慧的基礎
1.4.1 數學 1.4.2 經濟學 1.4.3 神經科學 1.4.4 認知心理學 1.4.5 控制理論與控制論
1.5 人工智慧的歷史
1.5.1 人工智慧的孕育和誕生 1.5.2 人工智慧的黃金年代 1.5.3 人工智慧的第一個冬天 1.5.4 人工智慧的第一次繁榮 1.5.5 人工智慧的第二個冬天 1.5.6 人工智慧的第二次繁榮
1.6 人工智慧的突破
1.6.1 計算機遊戲 1.6.2 計算機視覺 1.6.3 語音識別 1.6.4 機器翻譯 1.6.5 自動駕駛 1.6.6 人工大腦 1.6.7 人工智慧晶片 1.6.8 醫學人工智慧 1.6.9 藥物人工智慧 1.6.10 法律人工智慧
1.7 人工智慧的判定
1.7.1 圖靈測試 1.7.2 圖靈測試的解讀 1.7.3 圖靈測試2.0 1.7.4 中文房間
1.8 人工智慧的層級
1.8.1 人工專用智慧型 1.8.2 人工通用智慧型 1.8.3 人工超級智慧型
1.9 人工智慧的安全
1.10 人工智慧的套用
1.11 小結
習題
第2章 體系論
2.1 引言
2.2 人工智慧的研究途徑
2.2.1 控制論與人工智慧2.2.2 符號與亞符號 2.2.3 整齊與不整齊 2.2.4 邏輯與反邏輯 2.2.5 符號主義、聯結主義與行為主義 2.2.6 機率與統計方法 2.2.7 計算心理學、計算哲學與機器智慧型 2.2.8 經典與現代人工智慧
2.3 人工智慧的主體論點
2.3.1 智慧型主體 2.3.2 計算主體 2.3.3 理性主體
2.4 智慧型主體的環境
2.4.1 完全與部分可觀測 2.4.2 單主體與多主體 2.4.3 確定與隨機 2.4.4 偶發與順序 2.4.5 動態與靜態 2.4.6 離散與連續 2.4.7 已知與未知
2.5 智慧型主體的構成
2.5.1 主體函式 2.5.2 主體算法 2.5.3 主體結構
2.6 人工智慧的研究體系
2.6.1 人工智慧的本源 2.6.2 人工智慧的內涵 2.6.3 人工智慧的外延 2.6.4 人工智慧的體系
2.7 智慧型主體的思維
2.7.1 求解 2.7.2 規劃 2.7.3 學習 2.7.4 推理
2.8 智慧型主體的互動
2.8.1 感知 2.8.2 動作
2.9 智慧型主體的類型
2.9.1 主體的層次 2.9.2 求解型主體 2.9.3 規劃型主體 2.9.4 學習型主體 2.9.5 推理型主體
2.10 小結
習題
第二篇 求解
第3章 搜尋問題求解
3.1 引言
3.2 搜尋問題
3.1.1 智力遊戲問題 3.1.2 現實世界問題
3.3 搜尋問題的要素
3.3.1 狀態表征 3.3.2 狀態空間 3.3.3 形式化 3.3.4 求解的方法
3.4 搜尋問題的實例化
3.4.1 八數碼難題 3.4.2 八皇后難題 3.4.3 傳教士和食人族問題 3.4.4 最短路徑問題
3.5 搜尋求解的方式
3.5.1 樹搜尋 3.5.2 圖搜尋
3.6 無信息搜尋
3.6.1 寬度優先搜尋 3.6.2 深度優先搜尋 3.6.3 疊代深化搜尋
3.7 有信息搜尋
3.7.1 統一代價搜尋 3.7.2 貪婪最佳優先搜尋 3.7.3 A*搜尋
3.8 小結
習題
第4章 最佳化問題求解
4.1 引言
4.2 最佳化問題
4.2.1 智力遊戲問題 4.2.2 現實世界問題
4.3 最佳化問題的求解
4.3.1 局部搜尋 4.3.2 元啟發式 4.3.3 群體智慧型
4.4 局部搜尋方法
4.4.1 爬山法 4.4.2 局部束搜尋
4.5 元啟發式方法
4.5.1 禁忌搜尋 4.5.2 模擬退火算法 4.5.3 遺傳算法
4.6 群體智慧型方法
4.6.1 蟻群最佳化算法 4.6.2 粒子群最佳化算法
4.7 小結
習題
第5章 博弈問題求解
5.1 引言
5.2 博弈問題
5.2.1 智力遊戲問題 5.2.2 現實世界問題
5.3 博弈問題的類型
5.3.1 合作與非合作 5.3.2 零和與非零和 5.3.3 完美與不完美信息 5.3.4 對稱與非對稱 5.3.5 隨機與非隨機 5.3.6 同步與順序
5.4 博弈算法的歷史
5.5 博弈問題的求解
5.5.1 博弈問題的複雜性 5.5.2 對抗搜尋 5.5.3 博弈策略
5.6 完美信息博弈
5.6.1 最小最大策略 5.6.2 Alpha-Beta剪枝 5.6.3 蒙特卡羅樹搜尋 5.6.4 AlphaGo的博弈算法
5.7 不完美信息博弈
5.7.1 納什均衡與相關均衡 5.7.2 不完美信息博弈示例 5.7.3 遺憾最小化 5.7.4 虛擬遺憾最小化 5.7.5 DeepStack 5.7.6 Libratus
5.8 非對稱博弈
5.8.1 非對稱博弈概述 5.8.2 非對稱博弈的對稱分解
5.9 隨機博弈
5.9.1 隨機博弈概述 5.9.2 隨機博弈模型
5.10 小結
習題
第6章 約束問題求解
6.1 引言
6.2 約束問題
6.2.1 智力遊戲問題 6.2.2 現實世界問題
6.3 可能世界及其約束
6.3.1 可能世界 6.3.2 變數與值域 6.3.3 約束
6.4 約束滿足問題
6.4.1 形式化 6.4.2 狀態的表示 6.4.3 求解的方法
6.5 約束滿足問題的實例化
6.5.1 數獨 6.5.2 算式謎 6.5.3 地圖著色 6.5.4 作業調度
6.6 約束傳播
6.6.1 節點一致性 6.6.2 弧一致性 6.6.3 路徑一致性 6.6.4 k-一致性
6.7 回溯搜尋
6.7.1 回溯搜尋的實例 6.7.2 回溯搜尋算法 6.7.3 回溯算法的細化
6.8 局部搜尋
6.8.1 最少衝突啟發式 6.8.2 約束加權法
6.9 問題的結構
6.9.1 獨立子問題 6.9.2 樹結構問題
6.10 問題的改進
6.10.1 動態約束滿足問題 6.10.2 柔性約束滿足問題 6.10.3 分散約束滿足問題
6.11 小結
習題
第三篇 規劃
第7章 時空關聯規劃
7.1 引言
7.2 規劃問題
7.2.1 智力遊戲問題 7.2.2 現實世界問題
7.3 規劃語言
7.4 經典規劃
7.4.1 經典規劃的定義 7.4.2 狀態空間規劃 7.4.3 計畫空間規劃 7.4.4 經典規劃的分析
7.5 新經典規劃
7.5.1 規劃圖技法 7.5.2 命題可滿足性技法 7.5.3 邏輯演繹技法 7.5.4 約束滿足技法
7.6 時序規劃
7.6.1 時序參照及其關係 7.6.2 時序運算元方法 7.6.3 紀事方法
7.7 規劃與調度
7.7.1 調度問題的要素 7.7.2 設備調度問題 7.7.3 規劃與調度的整合
7.8 運動規劃
7.8.1 幾何表示與轉換 7.8.2 位姿空間 7.8.3 柵格運動規劃 7.8.4 採樣運動規劃 7.8.5 組合運動規劃
7.9 小結
習題
第8章 決策理論規劃
8.1 引言
8.2 決策理論規劃概述
8.3 馬爾科夫模型
8.3.1 隨機過程 8.3.2 馬爾科夫性質 8.3.3 馬爾科夫過程 8.3.4 馬爾科夫決策過程 8.3.5 隱馬爾科夫模型 8.3.6 部分可觀測馬爾科夫決策過程
8.4 馬爾科夫決策過程的最佳化控制
8.4.1 策略 8.4.2 獎懲與折扣 8.4.3 價值函式 8.4.4 貝爾曼公式 8.4.5 最佳化控制方法
8.5 動態規劃
8.5.1 策略疊代 8.5.2 價值疊代 8.5.3 異步動態規劃 8.5.4 廣義策略疊代
8.6 小結
習題
第四篇 學習
第9章 三個視角
9.1 引言
9.2 機器學習概述
9.2.1 機器學習的由來 9.2.2 學習的主要類型 9.2.3 機器學習與人工智慧 9.2.4 機器學習與相關研究領域
9.3 可能近似正確學習
9.4 沒有免費午餐定理
9.5 機器學習的歷史
9.5.1 神經網路 9.5.2 決策樹 9.5.3 提升算法 9.5.4 支撐向量機 9.5.5 強化學習
9.6 機器學習的難點
9.6.1 做什麼 9.6.2 什麼形式 9.6.3 如何做
9.7 機器學習的視角
9.7.1 學習任務 9.7.2 學習範式 9.7.3 學習框架
9.8 小結
習題
第10章 學習的任務
10.1 引言
10.2 學習任務概述
10.3 分類
10.3.1 定義 10.3.2 工作原理 10.3.3 線性與非線性 10.3.4 類別與維度 10.3.5 案例分析 10.3.6 套用領域
10.4 回歸
10.4.1 定義 10.4.2 工作原理 10.4.3 線性與非線性 10.4.4 案例分析 10.4.5 套用領域
10.5 聚類
10.5.1 定義 10.5.2 工作原理 10.5.3 主要途徑 10.5.4 案例分析 10.5.5 套用領域
10.6 排名
10.6.1 定義 10.6.2 工作原理 10.6.3 主要途徑 10.6.4 案例分析 10.6.5 套用領域
10.7 降維
10.7.1 定義 10.7.2 工作原理 10.7.3 線性與非線性 10.7.4 案例分析 10.7.5 套用領域
10.8 小結
習題
第11章 學習的範式
11.1 引言
11.2 學習範式概述
11.3 監督學習
11.3.1 定義 11.3.2 形式化描述 11.3.3 對應的學習任務 11.3.4 其它關聯範式
11.4 無監督學習
11.4.1 定義 11.4.2 對應的學習任務 11.4.3 重要性 11.4.4 其他途徑
11.5 強化學習
11.5.1 定義 11.5.2 強化學習的類型 11.5.3 蒙特卡羅方法 11.5.4 時序差分方法 11.5.5 適格錄跡 11.5.6 深度強化學習 11.5.7 強化學習算法比較
11.6 其他範式
11.6.1 學會學習 11.6.2 遷移學習 11.6.3 集成學習 11.6.4 對抗學習 11.6.5 協同學習
11.7 範式與任務的關係
11.8 小結
習題
第12章 學習的框架
12.1 引言
12.2 學習框架概述
12.3 機率框架
12.3.1 關於機率框架 12.3.2 生成與判別模型 12.3.3 機率圖模型 12.3.4 案例分析
12.4 統計框架 297
12.4.1 關於統計框架 12.4.2 參數模型 12.4.3 非參數模型 12.4.4 案例分析
12.5 幾何框架
12.5.1 關於幾何框架 12.5.2 超平面 12.5.3 流形 12.5.4 案例分析
12.6 聯結框架
12.6.1 關於聯結框架 12.6.2 人工神經網路 12.6.3 淺層與深層 12.6.4 前饋與非前饋 12.6.5 單主體與多主體 12.6.6 案列分析
12.7 邏輯框架
12.7.1 關於邏輯框架 12.7.2 基於邏輯 12.7.3 基於規則 12.7.4 案列分析
12.8 小結
習題
第五篇 推理
第13章 知識表示
13.1 引言
13.2 知識與表征
13.2.1 數據、信息、知識與智慧 13.2.2 知識的類型 13.2.3 顯性與隱性 13.2.4 知識系統 13.2.5 知識表示
13.3 知識表示的歷史
13.4 可能世界理論
13.4.1 可能世界 13.4.2 三種觀點 13.4.3 六個命題 13.4.4 三種性質
13.5 知識表示的範式
13.5.1 確定性與不確定性 13.5.2 過程性與陳述性 13.5.3 開放世界與封閉世界假設
13.6 確定性知識表示
13.6.1 語義網路 13.6.2 框架 13.6.3 經典邏輯 13.6.4 模態邏輯 13.6.5 描述邏輯 13.6.6 本體 13.6.7 資源描述框架 13.6.8 知識圖譜
13.7 不確定性知識表示
13.7.1 貝葉斯網路 13.7.2 可能性理論 13.7.3 證據理論
13.8 小結
習題
第14章 推理機制
14.1 引言
14.2 推理問題
14.2.1 智力遊戲問題 14.2.2 現實世界問題
14.3 推理模式
14.3.1 演繹推理 14.3.2 歸納推理 14.3.3 溯因推理 14.3.4 推理模式淺析
14.4 邏輯推理
14.4.1 關於邏輯推理 14.4.2 前向連結 14.4.3 後向連結
14.5 定性推理
14.5.1 關於定性推理 14.5.2 定性表示 14.5.3 定性推理技術
14.6 本體推理
14.6.1 關於本體推理 14.6.2 本體語言 14.6.3 本體推理器
14.7 機率推理
14.7.1 關於機率推理 14.7.2 頻率論推理 14.7.3 貝葉斯推理 14.7.4 貝葉斯網路推理 14.7.5 隨機仿真近似推理
14.8 機器推理
14.8.1 關於機器推理 14.8.2 神經模組網路推理 14.8.3 組合注意網路推理
14.9 推理的套用
14.10 小結
習題
參考文獻