《人工智慧—— 一種現代方法(第二版)》是2013年4月人民郵電出版社出版的圖書,作者是[美]Stuart Russell、Peter Norvig。
基本介紹
- 中文名:人工智慧—— 一種現代方法(第二版)
- 作者:[美]Stuart Russell、Peter Norvig
- 出版時間:2013年4月
- 出版社:人民郵電出版社
- 頁數:758 頁
- ISBN:9787115232274
- 定價:89 元
- 開本:16 開
- 裝幀:平裝
內容簡介,圖書目錄,
內容簡介
本書以詳盡和豐富的資料,從理性智慧型體的角度,全面闡述了人工智慧領域的跨祝烏核心和店局請內容,並深入介紹了各個主要的研究方向,是一本難得的綜合性教材。全書分為八大部分:第 一部分“人工智慧”,第 二部分“問題求解”,第三部分“知識與推理”,第四部分“規劃”,第五部分“不確定知識與推棄海狼理”,第六部分“學習”,第七部分“通訊、感知與行動”,第八部分“結論”。
本書既詳細介紹了大量的基本概念、思想和算法,也描述了各研究方向**前沿的進展,同時收集整理了詳實的歷史文獻與事件。因此本書適合於不同層次和領域的研究人員及學生,可以作為信息領域和相關領域的高等院校本科生和研究生的教材或教學輔導書目,也可以作為相關領域的科研與工程技術人員的參考書。
圖書目錄
第 一部分 人工智慧
第 1章 緒論 3
1.1 什麼是人工智慧 3
1.1.1 類人行為:圖靈測試方法 4
1.1.2 類人思考:認知模型方法 4
1.1.3 理性地思考:“思維法則”方法 5
1.1.4 理性地行動:理性智慧型體方法 5
1.2 人工智慧的基礎 6
1.2.1 哲學(公元前428年—現在) 6
1.2.2 數學(約800年—現在) 8
1.2.3 經濟學(1776年—現在) 9
1.2.4 神經科學(1861年—現在) 10
1.2.5 心理學(1879年—現在) 11
1.2.6 計算機工程(1940年—現在) 12
1.2.7 控制論(1948年—現在) 13
1.2.8 語言學(1957年—現在) 14
1.3 人工智慧的歷史 14
1.3.1 人工智慧的孕育期(1943年—1955年) 14
1.3.2 人工智慧的誕生(1956年) 15
1.3.3 早期的熱情,巨大的期望(1952年—1969年) 15
1.3.4 現實的困難(1966年—1973年) 17
1.3.5 基於知識的系統:力量的鑰匙?(1969年—1979年) 19
1.3.6 AI成為工業(1980年—現在) 20
1.3.7 神經元網路的回歸(1986年—現在) 20
1.3.8 AI成為科學(1987年—現在) 21
1.3.9 智慧型化智慧型體的出現(1995年—現在) 22
1.4 目前發展水平乃虹恥乎 22
1.5 小結 23
參考文獻與歷史的注釋 24
習題 24
第 2章 智慧型化智慧型體 26
2.1 智慧型體和環境 26
2.2 好的行為表現:理性的概念 28
2.2.1 性能度量 28
2.2.2 理性 28
2.2.3 全知者,學習和自主性 29
2.3 環境的本質 30
2.3.1 詳細說明任務環境 30
2.3.2 任務環境的屬性 32
2.4 智慧型體的結構 35
2.4.1 智慧型體程式 35
2.4.2 簡單眼射型智慧型體 36
2.4.3 基於模型的反射型智慧型體 38
2.4.4 基於目標的智慧型體 39
2.4.5 基於效用的智您駝籃能體 40
2.4.6 學習智慧型體 40
2.5 小結 42
參考文獻與歷史的注釋 42
習題 44
第 二部分 問題求解
第3章 用搜尋法對問題求解 49
3.1 問題求解智慧型體 49
3.1.1 定義明確的問題及解 51
3.1.2 把問題形式化 52
3.2 問題實例 53
3.2.1 玩具問題 53
3.2.2 現實世界問題 55
3.3 對解的搜尋 56
3.4 無信息的搜尋策略 59
3.4.1 廣度優先搜尋 59
3.4.2 代價一致搜尋 61
3.4.3 深度優先搜尋 61
3.4.4 深度有限搜尋 62
3.4.5 疊代深入深度優先搜尋 63
3.4.6 雙向搜尋 64
3.4.7 無信息搜尋策略的比較 65
3.5 避免重複狀態 66
3.6 使用不完全信息的搜尋 67
3.6.1 無感測問題 68
3.6.2 偶發性問題 69
3.7 小結 70
參考文獻與歷史的注釋 71
習題 72
第4章 有信息的搜尋和探索 76
4.1 有信息的(啟發式的)搜尋策略 76
4.1.1 貪婪**佳優先搜尋 77
4.1.2 A*搜尋:**小化總的估計解耗散 78
4.1.3 存儲限制的啟發式搜尋 81
4.1.4 為了更好地搜尋而學習 83
4.2 啟發函式 84
4.2.1 啟發函式屑才坑的精確度對性能的影響 85
4.2.2 設計可採納的啟發函式 85
4.2.3 從經驗里踏協學習啟發函式 87
4.3 局部搜尋算法和**最佳化問題 88
4.3.1 爬山法搜尋 88
4.3.2 模擬退火搜尋 91
4.3.3 局部剪枝搜尋 92
4.3.4 遺傳算法 92
4.4 連續空間的局部搜尋 95
4.5 在線上搜尋智慧型體和未知環境 96
4.5.1 在線上搜尋問題 97
4.5.2 在線上搜尋智慧型體 98
4.5.3 在線上局部搜尋 99
4.5.4 在線上搜尋的學習 101
4.6 小結 101
參考文獻與歷史的注釋 102
習題 105
第5章 約束滿足問題 108
5.1 約束滿足問題 108
5.2 CSP問題的回溯搜尋 111
5.2.1 變數和取值順序 112
5.2.2 通過約束傳播信息 113
5.3 約束滿足問題的局部搜尋 117
5.4 問題的結構 118
5.5 小結 120
參考文獻與歷史的注釋 121
習題 123
第6章 對抗搜尋 125
6.1 博弈 125
6.2 博弈中的最佳化決策 126
6.2.1 **優策略 127
6.2.2 極小極大值算法 128
6.2.3 多人遊戲中的**優決策 128
6.3 a-b剪枝 129
6.4 不完整的實時決策 132
6.4.1 評價函式 132
6.4.2 截斷搜尋 134
6.5 包含幾率因素的遊戲 135
6.5.1 有幾率節點的遊戲中的局面評價 137
6.5.2 期望極小極大值的複雜度 137
6.5.3 牌類遊戲 138
6.6 博弈程式的當前發展水平 139
6.7 討論 141
6.8 小結 142
參考文獻與歷史的注釋 143
習題 146
第三部分 知識與推理
第7章 邏輯智慧型體 151
7.1 基於知識的智慧型體 152
7.2 wumpus世界 153
7.3 邏輯 155
7.4 命題邏輯:一種非常簡單的邏輯 158
7.4.1 語法 158
7.4.2 語義 159
7.4.3 一個簡單的知識庫 160
7.4.4 推理 161
7.4.5 等價、合法性和可滿足性 162
7.5 命題邏輯的推理模式 163
7.5.1 歸結 164
7.5.2 合取範式 166
7.5.3 歸結算法 166
7.5.4 歸結的完備性 167
7.5.5 前向和反向連結 168
7.6 有效的命題推理 170
7.6.1 一個完備的回溯搜尋 170
7.6.2 局部搜尋算法 171
7.6.3 困難的滿足性問題 172
7.7 基於命題邏輯的智慧型體 173
7.7.1 用邏輯推理尋找陷阱和wumpus 173
7.7.2 記錄位置和方向 174
7.7.3 基於電路的智慧型體 175
7.7.4 比較 177
7.8 小結 178
參考文獻與歷史的注釋 179
習題 181
第8章 一階邏輯 184
8.1 表示方法的回顧 184
8.2 一階邏輯的語法和語義 187
8.2.1 一階邏輯的模型 187
8.2.2 符號和解釋 188
8.2.3 項 189
8.2.4 原子語句 190
8.2.5 複合語句 190
8.2.6 量詞 190
8.2.7 等式 193
8.3 使用一階邏輯 193
8.3.1 一階邏輯的斷言和查詢 194
8.3.2 親屬關係域 194
8.3.3 數、集合和列表 195
8.3.4 wumpus世界 197
8.4 一階邏輯中的知識工程 199
8.4.1 知識工程的過程 199
8.4.2 電路領域 200
8.5 小結 203
參考文獻與歷史的注釋 203
習題 204
第9章 一階邏輯中的推理 208
9.1 命題與一階推理 208
9.1.1 量詞的推理規則 208
9.1.2 簡化到命題推理 209
9.2 合一和提升 210
9.2.1 一階推理規則 210
9.2.2 合一 211
9.2.3 存儲和檢索 212
9.3 前向連結 214
9.3.1 一階確定子句 214
9.3.2 一個簡單的前向連結算法 215
9.3.3 高效的前向連結 216
9.4 反向連結 219
9.4.1 反向連結算法 219
9.4.2 邏輯程式設計 220
9.4.3 邏輯程式的高效實現 221
9.4.4 冗餘推理和無限循環 223
9.4.5 約束邏輯程式設計 224
9.5 歸結 225
9.5.1 一階邏輯的合取範式 226
9.5.2 歸結推理規則 227
9.5.3 證明的實例 227
9.5.4 歸結的完備性 229
9.5.5 處理等式 231
9.5.6 歸結策略 232
9.5.7 定理證明機 233
9.6 小結 236
參考文獻與歷史的注釋 236
習題 240
第 10章 知識表示 244
10.1 本體論工程 244
10.2 類別和對象 246
10.2.1 物質成份 247
10.2.2 度量 249
10.2.3 物質和對象 249
10.3 行動、情景和事件 250
10.3.1 情景演算本體論 250
10.3.2 描述情景演算中的行動 252
10.3.3 解決表示框架問題 253
10.3.4 解決推理框架問題 254
10.3.5 時間和事件演算 255
10.3.6 一般化事件 255
10.3.7 過程 257
10.3.8 區間 258
10.3.9 流和對象 259
10.4 精神事件和精神對象 260
10.4.1 關於信度的形式理論 260
10.4.2 知識和信度 262
10.4.3 知識、時間和行動 262
10.5 網際網路購物世界 263
10.6 類別的推理系統 267
10.6.1 語義網路 267
10.6.2 描述邏輯 269
10.7 預設信息推理 270
10.7.1 開放世界和封閉世界 270
10.7.2 失敗否定式和穩定模型語義 272
10.7.3 界限和預設邏輯 273
10.8 真值維護系統 275
10.9 小結 276
參考文獻與歷史的注釋 276
習題 281
第四部分 規劃
第 11章 規劃 289
11.1 規劃問題 289
11.1.1 規劃問題語言 290
11.1.2 表達能力和延伸 291
11.1.3 例:航空貨物運輸 292
11.1.4 例:備用輪胎問題 293
11.1.5 例:積木世界 293
11.2 狀態空間搜尋規劃 294
11.2.1 前向狀態空間搜尋 295
11.2.2 後向狀態空間搜尋 296
11.2.3 狀態空間搜尋的啟發式 297
11.3 偏序規劃 298
11.3.1 一個偏序規劃的例子 301
11.3.2 無約束變數的偏序規劃 303
11.3.3 偏序規劃啟發式 303
11.4 規劃圖 304
11.4.1 規劃圖的啟發式估計 305
11.4.2 GRAPHPLAN算法 306
11.4.3 GRAPHPLAN的終止 308
11.5 命題邏輯規劃 309
11.5.1 用命題邏輯描述規劃問題 309
11.5.2 命題編碼的複雜度 311
11.6 規劃方法分析 312
11.7 小結 313
參考文獻與歷史的注釋 314
習題 316
第 12章 現實世界的規劃與行動 320
12.1 時間、調度表和資源 320
12.2 分層任務網路規劃 324
12.2.1 表示行動分解 325
12.2.2 為分解修改規劃器 326
12.2.3 討論 328
12.3 在非確定性領域中進行規劃和行動 329
12.4 條件規劃 331
12.4.1 完全可觀察環境中的條件規劃 331
12.4.2 部分可觀察環境中的條件規劃 334
12.5 執行監控和重新規劃 337
12.6 持續規劃 340
12.7 多智慧型體規劃 343
12.7.1 合作:聯合目標和規劃 344
12.7.2 多體規劃 344
12.7.3 協調機制 346
12.7.4 競爭 347
12.8 小結 347
參考文獻與歷史的注釋 347
習題 350
第五部分 不確定知識與推理
第 13章 不確定性 355
13.1 不確定環境下的行動 355
13.1.1 處理不確定知識 356
13.1.2 不確定性與理性決策 357
13.1.3 決策理論智慧型體的設計 358
13.2 基本機率符號表示 358
13.2.1 命題 358
13.2.2 原子事件 359
13.2.3 先驗機率 360
13.2.4 條件機率 361
13.3 機率公理 362
13.3.1 使用機率公理 363
13.3.2 為什麼機率公理是合理的 363
13.4 使用全聯合分布進行推理 365
13.5 獨立性 367
13.6 貝葉斯法則及其套用 368
13.6.1 套用貝葉斯法則:一個簡單例子 368
13.6.2 使用貝葉斯法則:合併證據 369
13.7 重遊wumpus世界 371
13.8 小結 373
參考文獻與歷史的注釋 374
習題 375
第 14章 機率推理 378
14.1 不確定域中的知識表示 378
14.2 貝葉斯網路的語義 380
14.2.1 表示全聯合機率分布 380
14.2.2 貝葉斯網路中的條件獨立關係 383
14.3 條件分布的有效表達 384
14.4 貝葉斯網路中的精確推理 387
14.4.1 通過枚舉進行推理 387
14.4.2 變數消元算法 389
14.4.3 精確推理的複雜度 391
14.4.4 團算法 392
14.5 貝葉斯網路的近似推理 392
14.5.1 直接採樣算法 392
14.5.2 馬爾可夫鏈仿真推理 396
14.6 把機率擴展到一階表示 398
14.7 不確定推理的其它方法 401
14.7.1 基於規則的不確定推理方法 402
14.7.2 表示無知性:Dempster-Shafer理論 403
14.7.3 表示模糊性:模糊集與模糊邏輯 404
14.8 小結 405
參考文獻與歷史的注釋 406
習題 409
第 15章 關於時間的機率推理 413
15.1 時間與不確定性 413
15.1.1 狀態與觀察 414
15.1.2 穩態過程與馬爾可夫假設 414
15.2 時序模型中的推理 416
15.2.1 濾波和預測 417
15.2.2 平滑 419
15.2.3 尋找**可能序列 421
15.3 隱馬爾可夫模型 422
15.4 卡爾曼濾波器 424
15.4.1 更新高斯分布 425
15.4.2 一個簡單的一維例子 426
15.4.3 一般情況 428
15.4.4 卡爾曼濾波器的適用性 429
15.5 動態貝葉斯網路 430
15.5.1 構造動態貝葉斯網路 430
15.5.2 動態貝葉斯網路中的精確推理 433
15.5.3 動態貝葉斯網路中的近似推理 434
15.6 語音識別 437
15.6.1 語音 438
15.6.2 詞語(word) 440
15.6.3 語句 441
15.6.4 搭建語音識別器 443
15.7 小結 444
參考文獻與歷史的注釋 445
習題 447
第 16章 制定簡單決策 450
16.1 在不確定性環境下結合信度與願望 450
16.2 效用理論基礎 451
16.2.1 理性偏好的約束 451
16.2.2 然後就有了效用 453
16.3 效用函式 453
16.3.1 金錢的效用 454
16.3.2 效用範圍和效用評估 455
16.4 多屬性效用函式 457
16.4.1 優勢 457
16.4.2 偏好結構和多屬性效用 458
16.5 決策網路 460
16.5.1 使用決策網路表示決策問題 460
16.5.2 評價決策網路 461
16.6 信息價值 462
16.6.1 一個簡單例子 462
16.6.2 一個通用公式 462
16.6.3 信息價值的屬性 464
16.6.4 實現信息收集智慧型體 464
16.7 決策理論的專家系統 465
16.8 小結 467
參考文獻與歷史的注釋 467
習題 469
第 17章 制定複雜決策 472
17.1 延續式決策問題 472
17.1.1 一個例子 472
17.1.2 延續式決策問題中的**最佳化 474
17.2 價值疊代 476
17.2.1 狀態效用值 476
17.2.2 價值疊代算法 477
17.2.3 價值疊代的收斂 478
17.3 策略疊代 480
17.4 部分可觀察的MDP 481
17.5 決策理論智慧型體 484
17.6 多智慧型體的決策:博弈論 485
17.7 機制設計 492
17.8 小結 494
參考文獻與歷史的注釋 495
習題 496
第六部分 學習
第 18章 從觀察中學習 501
18.1 學習的形式 501
18.2 歸納學習 502
18.3 學習決策樹 504
18.3.1 作為執行元件的決策樹 504
18.3.2 決策樹的表達能力 505
18.3.3 從實例中歸納決策樹 506
18.3.4 選擇屬性測試 508
18.3.5 評估學習算法的性能 509
18.3.6 噪聲和過擬合 510
18.3.7 擴展決策樹的適用性 512
18.4 集體學習 512
18.5 為什麼學習是可行的:計算學習理論 515
18.5.1 需要多少個實例 516
18.5.2 決策表學習 517
18.5.3 討論 519
18.6 小結 519
參考文獻與歷史的注釋 519
習題 521
第 19章 學習中的知識 524
19.1 學習的邏輯公式 524
19.1.1 實例和假設 524
19.1.2 當前**佳假設搜尋 526
19.1.3 **少約定搜尋 527
19.2 學習中的知識 530
19.2.1 一些簡單的例子 531
19.2.2 一些一般方案 531
19.3 基於解釋的學習 532
19.3.1 從實例中抽取一般規則 533
19.3.2 提高效率 534
19.4 使用相關信息進行學習 535
19.4.1 決定假設空間 536
19.4.2 學習和使用相關性信息 536
19.5 歸納邏輯程式設計 538
19.5.1 一個例子 539
19.5.2 自頂向下的歸納學習方法 541
19.5.3 使用逆向演繹的歸納學習 543
19.5.4 通過歸納邏輯程式設計進行發現 544
19.6 小結 545
參考文獻與歷史的注釋 546
習題 548
第 20章 統計學習方法 550
20.1 統計學習 550
20.2 完整數據下的學習 553
20.2.1 **大似然參數學習:離散模型 553
20.2.2 樸素貝葉斯模型 555
20.2.3 **大似然參數學習:連續模型 555
20.2.4 貝葉斯參數學習 557
20.2.5 學習貝葉斯網路的結構 558
20.3 隱變數學習:EM算法 559
20.3.1 無監督聚類:學習混合高斯分布 560
20.3.2 學習含有隱變數的貝葉斯網路 562
20.3.3 學習隱馬爾可夫模型 563
20.3.4 EM算法的一般形式 564
20.3.5 學習含有隱變數的貝葉斯網路結構 564
20.4 基於實例的學習 565
20.4.1 **近鄰模型 565
20.4.2 核模型 567
20.5 神經元網路 568
20.5.1 神經元網路中的單元 568
20.5.2 網路結構 569
20.5.3 單層前饋神經元網路(感知器) 570
20.5.4 多層前饋神經元網路 573
20.5.5 對神經元網路結構進行學習 576
20.6 核心機 576
20.7 案例分析:手寫體數字識別 579
20.8 小結 580
參考文獻與歷史的注釋 581
習題 584
第 21章 強化學習 587
21.1 介紹 587
21.2 被動強化學習 588
21.2.1 直接效用估計 589
21.2.2 自適應動態規劃 589
21.2.3 時序差分學習 591
21.3 主動強化學習 592
21.3.1 探索 593
21.3.2 學習行動-價值函式 595
21.4 強化學習中的一般化 596
21.4.1 博弈中的套用 599
21.4.2 機器人控制中的套用 599
21.5 策略搜尋 600
21.6 小結 602
參考書目與歷史的注釋 603
習題 605
第七部分 通訊、感知與行動
第 22章 通訊 609
22.1 作為行動的通訊 609
22.1.1 語言的基本原理 610
22.1.2 通訊的組成步驟 611
22.2 部分英語的形式語法 613
22.2.1 E0的詞典 613
22.2.2 E0的語法 614
22.3 句法分析(Parsing) 615
22.4 增強語法 620
22.4.1 動詞的次範疇化 622
22.4.2 增強語法的生成能力 623
22.5 語義解釋 624
22.5.1 部分英語的語義 625
22.5.2 時間和時態 625
22.5.3 量詞限定 626
22.5.4 語用解釋 628
22.5.5 利用DCG生成語言 629
22.6 歧義和排歧 629
22.7 篇章理解 632
22.7.1 指代消解 632
22.7.2 連貫的篇章結構 633
22.8 語法歸納 634
22.9 小結 636
參考文獻與歷史的注釋 636
習題 639
第 23章 機率語言處理 643
23.1 機率語言模型 643
23.1.1 機率的上下文無關語法 645
23.1.2 學習PCFG的機率 646
23.1.3 學習PCFG的規則結構 647
23.2 信息檢索 647
23.2.1 評價IR系統 649
23.2.2 IR的改進方法 650
23.2.3 結果集合的表示 651
23.2.4 IR系統的實現 652
23.3 信息抽取 653
23.4 機器翻譯 655
23.4.1 機器翻譯系統 656
23.4.2 統計機器翻譯 657
23.4.3 機器翻譯的機率學習 659
23.5 小結 660
參考文獻與歷史的注釋 661
習題 663
第 24章 感知 665
24.1 介紹 665
24.2 圖像生成 666
24.2.1 無透鏡成像 針孔照相機 666
24.2.2 透鏡系統 667
24.2.3 光線:成像過程中的光度學特性 668
24.2.4 色彩:成像中的分光譜光度學 669
24.3 初級圖像處理運算 669
24.3.1 邊緣檢測 670
24.3.2 圖像分割 672
24.4 提取三維信息 672
24.4.1 運動 673
24.4.2 雙目立體視覺 675
24.4.3 紋理梯度 677
24.4.4 明暗 677
24.4.5 輪廓 678
24.5 物體識別 681
24.5.1 基於亮度的識別 682
24.5.2 基於特徵的識別 683
24.5.3 姿態估計 685
24.6 利用視覺實現操縱和導航 686
24.7 小結 687
參考文獻與歷史的注釋 688
習題 690
第 25章 機器人學 692
25.1 介紹 692
25.2 機器人硬體 693
25.2.1 感測器 693
25.2.2 效應器 694
25.3 機器人的感知 696
25.3.1 定位 697
25.3.2 繪製地圖 701
25.3.3 其它類型的感知 703
25.4 運動規劃 703
25.4.1 構型空間 704
25.4.2 單元分解方法 706
25.4.3 抽骨架方法 707
25.5 規劃不確定的運動 708
25.6 運動 711
25.6.1 動力學和控制 711
25.6.2 勢場控制 713
25.6.3 反應式控制 714
25.7 機器人軟體體系結構 715
25.7.1 包容體系結構 715
25.7.2 三層體系結構 716
25.7.3 機器人程式設計語言 716
25.8 套用領域 717
25.9 小結 719
參考文獻與歷史的注釋 720
習題 722
第八部分 結論
第 26章 哲學基礎 729
26.1 弱人工智慧:機器能夠智慧型地行動嗎 729
26.1.1 能力缺陷方面的論點 730
26.1.2 數學異議 731
26.1.3 非形式化的論點 732
26.2 強人工智慧:機器能夠真正思考嗎 733
26.2.1 精神-肉體問題 734
26.2.2 “缽中之腦”實驗 735
26.2.3 大腦置換實驗 736
26.2.4 中文屋子 737
26.3 發展人工智慧的道德規範與風險 739
26.4 小結 742
參考文獻與歷史的注釋 742
習題 744
第 27章 人工智慧:現狀與未來 745
27.1 智慧型體的組成部分 745
27.2 智慧型體體系結構 747
27.3 我們在沿著正確的方向前進嗎 748
27.4 如果人工智慧成功了會怎樣 749
附錄A 數學背景 751
A.1 複雜度分析與O()符號 751
A.1.1 漸近分析 751
A.1.2 NP以及固有的難題 752
A.2 向量、矩陣和線性代數 753
A.3 機率分布 754
參考文獻與歷史的注釋 755
附錄B 關於語言和算法的注釋 757
B.1 用巴克斯-諾魯範式(BNF)定義語言 757
B.2 算法的偽代碼描述 757
B.3 在線上幫助 758
參考文獻 (見人民郵電出版社網站)
習題 24
第 2章 智慧型化智慧型體 26
2.1 智慧型體和環境 26
2.2 好的行為表現:理性的概念 28
2.2.1 性能度量 28
2.2.2 理性 28
2.2.3 全知者,學習和自主性 29
2.3 環境的本質 30
2.3.1 詳細說明任務環境 30
2.3.2 任務環境的屬性 32
2.4 智慧型體的結構 35
2.4.1 智慧型體程式 35
2.4.2 簡單眼射型智慧型體 36
2.4.3 基於模型的反射型智慧型體 38
2.4.4 基於目標的智慧型體 39
2.4.5 基於效用的智慧型體 40
2.4.6 學習智慧型體 40
2.5 小結 42
參考文獻與歷史的注釋 42
習題 44
第 二部分 問題求解
第3章 用搜尋法對問題求解 49
3.1 問題求解智慧型體 49
3.1.1 定義明確的問題及解 51
3.1.2 把問題形式化 52
3.2 問題實例 53
3.2.1 玩具問題 53
3.2.2 現實世界問題 55
3.3 對解的搜尋 56
3.4 無信息的搜尋策略 59
3.4.1 廣度優先搜尋 59
3.4.2 代價一致搜尋 61
3.4.3 深度優先搜尋 61
3.4.4 深度有限搜尋 62
3.4.5 疊代深入深度優先搜尋 63
3.4.6 雙向搜尋 64
3.4.7 無信息搜尋策略的比較 65
3.5 避免重複狀態 66
3.6 使用不完全信息的搜尋 67
3.6.1 無感測問題 68
3.6.2 偶發性問題 69
3.7 小結 70
參考文獻與歷史的注釋 71
習題 72
第4章 有信息的搜尋和探索 76
4.1 有信息的(啟發式的)搜尋策略 76
4.1.1 貪婪**佳優先搜尋 77
4.1.2 A*搜尋:**小化總的估計解耗散 78
4.1.3 存儲限制的啟發式搜尋 81
4.1.4 為了更好地搜尋而學習 83
4.2 啟發函式 84
4.2.1 啟發函式的精確度對性能的影響 85
4.2.2 設計可採納的啟發函式 85
4.2.3 從經驗里學習啟發函式 87
4.3 局部搜尋算法和**最佳化問題 88
4.3.1 爬山法搜尋 88
4.3.2 模擬退火搜尋 91
4.3.3 局部剪枝搜尋 92
4.3.4 遺傳算法 92
4.4 連續空間的局部搜尋 95
4.5 在線上搜尋智慧型體和未知環境 96
4.5.1 在線上搜尋問題 97
4.5.2 在線上搜尋智慧型體 98
4.5.3 在線上局部搜尋 99
4.5.4 在線上搜尋的學習 101
4.6 小結 101
參考文獻與歷史的注釋 102
習題 105
第5章 約束滿足問題 108
5.1 約束滿足問題 108
5.2 CSP問題的回溯搜尋 111
5.2.1 變數和取值順序 112
5.2.2 通過約束傳播信息 113
5.3 約束滿足問題的局部搜尋 117
5.4 問題的結構 118
5.5 小結 120
參考文獻與歷史的注釋 121
習題 123
第6章 對抗搜尋 125
6.1 博弈 125
6.2 博弈中的最佳化決策 126
6.2.1 **優策略 127
6.2.2 極小極大值算法 128
6.2.3 多人遊戲中的**優決策 128
6.3 a-b剪枝 129
6.4 不完整的實時決策 132
6.4.1 評價函式 132
6.4.2 截斷搜尋 134
6.5 包含幾率因素的遊戲 135
6.5.1 有幾率節點的遊戲中的局面評價 137
6.5.2 期望極小極大值的複雜度 137
6.5.3 牌類遊戲 138
6.6 博弈程式的當前發展水平 139
6.7 討論 141
6.8 小結 142
參考文獻與歷史的注釋 143
習題 146
第三部分 知識與推理
第7章 邏輯智慧型體 151
7.1 基於知識的智慧型體 152
7.2 wumpus世界 153
7.3 邏輯 155
7.4 命題邏輯:一種非常簡單的邏輯 158
7.4.1 語法 158
7.4.2 語義 159
7.4.3 一個簡單的知識庫 160
7.4.4 推理 161
7.4.5 等價、合法性和可滿足性 162
7.5 命題邏輯的推理模式 163
7.5.1 歸結 164
7.5.2 合取範式 166
7.5.3 歸結算法 166
7.5.4 歸結的完備性 167
7.5.5 前向和反向連結 168
7.6 有效的命題推理 170
7.6.1 一個完備的回溯搜尋 170
7.6.2 局部搜尋算法 171
7.6.3 困難的滿足性問題 172
7.7 基於命題邏輯的智慧型體 173
7.7.1 用邏輯推理尋找陷阱和wumpus 173
7.7.2 記錄位置和方向 174
7.7.3 基於電路的智慧型體 175
7.7.4 比較 177
7.8 小結 178
參考文獻與歷史的注釋 179
習題 181
第8章 一階邏輯 184
8.1 表示方法的回顧 184
8.2 一階邏輯的語法和語義 187
8.2.1 一階邏輯的模型 187
8.2.2 符號和解釋 188
8.2.3 項 189
8.2.4 原子語句 190
8.2.5 複合語句 190
8.2.6 量詞 190
8.2.7 等式 193
8.3 使用一階邏輯 193
8.3.1 一階邏輯的斷言和查詢 194
8.3.2 親屬關係域 194
8.3.3 數、集合和列表 195
8.3.4 wumpus世界 197
8.4 一階邏輯中的知識工程 199
8.4.1 知識工程的過程 199
8.4.2 電路領域 200
8.5 小結 203
參考文獻與歷史的注釋 203
習題 204
第9章 一階邏輯中的推理 208
9.1 命題與一階推理 208
9.1.1 量詞的推理規則 208
9.1.2 簡化到命題推理 209
9.2 合一和提升 210
9.2.1 一階推理規則 210
9.2.2 合一 211
9.2.3 存儲和檢索 212
9.3 前向連結 214
9.3.1 一階確定子句 214
9.3.2 一個簡單的前向連結算法 215
9.3.3 高效的前向連結 216
9.4 反向連結 219
9.4.1 反向連結算法 219
9.4.2 邏輯程式設計 220
9.4.3 邏輯程式的高效實現 221
9.4.4 冗餘推理和無限循環 223
9.4.5 約束邏輯程式設計 224
9.5 歸結 225
9.5.1 一階邏輯的合取範式 226
9.5.2 歸結推理規則 227
9.5.3 證明的實例 227
9.5.4 歸結的完備性 229
9.5.5 處理等式 231
9.5.6 歸結策略 232
9.5.7 定理證明機 233
9.6 小結 236
參考文獻與歷史的注釋 236
習題 240
第 10章 知識表示 244
10.1 本體論工程 244
10.2 類別和對象 246
10.2.1 物質成份 247
10.2.2 度量 249
10.2.3 物質和對象 249
10.3 行動、情景和事件 250
10.3.1 情景演算本體論 250
10.3.2 描述情景演算中的行動 252
10.3.3 解決表示框架問題 253
10.3.4 解決推理框架問題 254
10.3.5 時間和事件演算 255
10.3.6 一般化事件 255
10.3.7 過程 257
10.3.8 區間 258
10.3.9 流和對象 259
10.4 精神事件和精神對象 260
10.4.1 關於信度的形式理論 260
10.4.2 知識和信度 262
10.4.3 知識、時間和行動 262
10.5 網際網路購物世界 263
10.6 類別的推理系統 267
10.6.1 語義網路 267
10.6.2 描述邏輯 269
10.7 預設信息推理 270
10.7.1 開放世界和封閉世界 270
10.7.2 失敗否定式和穩定模型語義 272
10.7.3 界限和預設邏輯 273
10.8 真值維護系統 275
10.9 小結 276
參考文獻與歷史的注釋 276
習題 281
第四部分 規劃
第 11章 規劃 289
11.1 規劃問題 289
11.1.1 規劃問題語言 290
11.1.2 表達能力和延伸 291
11.1.3 例:航空貨物運輸 292
11.1.4 例:備用輪胎問題 293
11.1.5 例:積木世界 293
11.2 狀態空間搜尋規劃 294
11.2.1 前向狀態空間搜尋 295
11.2.2 後向狀態空間搜尋 296
11.2.3 狀態空間搜尋的啟發式 297
11.3 偏序規劃 298
11.3.1 一個偏序規劃的例子 301
11.3.2 無約束變數的偏序規劃 303
11.3.3 偏序規劃啟發式 303
11.4 規劃圖 304
11.4.1 規劃圖的啟發式估計 305
11.4.2 GRAPHPLAN算法 306
11.4.3 GRAPHPLAN的終止 308
11.5 命題邏輯規劃 309
11.5.1 用命題邏輯描述規劃問題 309
11.5.2 命題編碼的複雜度 311
11.6 規劃方法分析 312
11.7 小結 313
參考文獻與歷史的注釋 314
習題 316
第 12章 現實世界的規劃與行動 320
12.1 時間、調度表和資源 320
12.2 分層任務網路規劃 324
12.2.1 表示行動分解 325
12.2.2 為分解修改規劃器 326
12.2.3 討論 328
12.3 在非確定性領域中進行規劃和行動 329
12.4 條件規劃 331
12.4.1 完全可觀察環境中的條件規劃 331
12.4.2 部分可觀察環境中的條件規劃 334
12.5 執行監控和重新規劃 337
12.6 持續規劃 340
12.7 多智慧型體規劃 343
12.7.1 合作:聯合目標和規劃 344
12.7.2 多體規劃 344
12.7.3 協調機制 346
12.7.4 競爭 347
12.8 小結 347
參考文獻與歷史的注釋 347
習題 350
第五部分 不確定知識與推理
第 13章 不確定性 355
13.1 不確定環境下的行動 355
13.1.1 處理不確定知識 356
13.1.2 不確定性與理性決策 357
13.1.3 決策理論智慧型體的設計 358
13.2 基本機率符號表示 358
13.2.1 命題 358
13.2.2 原子事件 359
13.2.3 先驗機率 360
13.2.4 條件機率 361
13.3 機率公理 362
13.3.1 使用機率公理 363
13.3.2 為什麼機率公理是合理的 363
13.4 使用全聯合分布進行推理 365
13.5 獨立性 367
13.6 貝葉斯法則及其套用 368
13.6.1 套用貝葉斯法則:一個簡單例子 368
13.6.2 使用貝葉斯法則:合併證據 369
13.7 重遊wumpus世界 371
13.8 小結 373
參考文獻與歷史的注釋 374
習題 375
第 14章 機率推理 378
14.1 不確定域中的知識表示 378
14.2 貝葉斯網路的語義 380
14.2.1 表示全聯合機率分布 380
14.2.2 貝葉斯網路中的條件獨立關係 383
14.3 條件分布的有效表達 384
14.4 貝葉斯網路中的精確推理 387
14.4.1 通過枚舉進行推理 387
14.4.2 變數消元算法 389
14.4.3 精確推理的複雜度 391
14.4.4 團算法 392
14.5 貝葉斯網路的近似推理 392
14.5.1 直接採樣算法 392
14.5.2 馬爾可夫鏈仿真推理 396
14.6 把機率擴展到一階表示 398
14.7 不確定推理的其它方法 401
14.7.1 基於規則的不確定推理方法 402
14.7.2 表示無知性:Dempster-Shafer理論 403
14.7.3 表示模糊性:模糊集與模糊邏輯 404
14.8 小結 405
參考文獻與歷史的注釋 406
習題 409
第 15章 關於時間的機率推理 413
15.1 時間與不確定性 413
15.1.1 狀態與觀察 414
15.1.2 穩態過程與馬爾可夫假設 414
15.2 時序模型中的推理 416
15.2.1 濾波和預測 417
15.2.2 平滑 419
15.2.3 尋找**可能序列 421
15.3 隱馬爾可夫模型 422
15.4 卡爾曼濾波器 424
15.4.1 更新高斯分布 425
15.4.2 一個簡單的一維例子 426
15.4.3 一般情況 428
15.4.4 卡爾曼濾波器的適用性 429
15.5 動態貝葉斯網路 430
15.5.1 構造動態貝葉斯網路 430
15.5.2 動態貝葉斯網路中的精確推理 433
15.5.3 動態貝葉斯網路中的近似推理 434
15.6 語音識別 437
15.6.1 語音 438
15.6.2 詞語(word) 440
15.6.3 語句 441
15.6.4 搭建語音識別器 443
15.7 小結 444
參考文獻與歷史的注釋 445
習題 447
第 16章 制定簡單決策 450
16.1 在不確定性環境下結合信度與願望 450
16.2 效用理論基礎 451
16.2.1 理性偏好的約束 451
16.2.2 然後就有了效用 453
16.3 效用函式 453
16.3.1 金錢的效用 454
16.3.2 效用範圍和效用評估 455
16.4 多屬性效用函式 457
16.4.1 優勢 457
16.4.2 偏好結構和多屬性效用 458
16.5 決策網路 460
16.5.1 使用決策網路表示決策問題 460
16.5.2 評價決策網路 461
16.6 信息價值 462
16.6.1 一個簡單例子 462
16.6.2 一個通用公式 462
16.6.3 信息價值的屬性 464
16.6.4 實現信息收集智慧型體 464
16.7 決策理論的專家系統 465
16.8 小結 467
參考文獻與歷史的注釋 467
習題 469
第 17章 制定複雜決策 472
17.1 延續式決策問題 472
17.1.1 一個例子 472
17.1.2 延續式決策問題中的**最佳化 474
17.2 價值疊代 476
17.2.1 狀態效用值 476
17.2.2 價值疊代算法 477
17.2.3 價值疊代的收斂 478
17.3 策略疊代 480
17.4 部分可觀察的MDP 481
17.5 決策理論智慧型體 484
17.6 多智慧型體的決策:博弈論 485
17.7 機制設計 492
17.8 小結 494
參考文獻與歷史的注釋 495
習題 496
第六部分 學習
第 18章 從觀察中學習 501
18.1 學習的形式 501
18.2 歸納學習 502
18.3 學習決策樹 504
18.3.1 作為執行元件的決策樹 504
18.3.2 決策樹的表達能力 505
18.3.3 從實例中歸納決策樹 506
18.3.4 選擇屬性測試 508
18.3.5 評估學習算法的性能 509
18.3.6 噪聲和過擬合 510
18.3.7 擴展決策樹的適用性 512
18.4 集體學習 512
18.5 為什麼學習是可行的:計算學習理論 515
18.5.1 需要多少個實例 516
18.5.2 決策表學習 517
18.5.3 討論 519
18.6 小結 519
參考文獻與歷史的注釋 519
習題 521
第 19章 學習中的知識 524
19.1 學習的邏輯公式 524
19.1.1 實例和假設 524
19.1.2 當前**佳假設搜尋 526
19.1.3 **少約定搜尋 527
19.2 學習中的知識 530
19.2.1 一些簡單的例子 531
19.2.2 一些一般方案 531
19.3 基於解釋的學習 532
19.3.1 從實例中抽取一般規則 533
19.3.2 提高效率 534
19.4 使用相關信息進行學習 535
19.4.1 決定假設空間 536
19.4.2 學習和使用相關性信息 536
19.5 歸納邏輯程式設計 538
19.5.1 一個例子 539
19.5.2 自頂向下的歸納學習方法 541
19.5.3 使用逆向演繹的歸納學習 543
19.5.4 通過歸納邏輯程式設計進行發現 544
19.6 小結 545
參考文獻與歷史的注釋 546
習題 548
第 20章 統計學習方法 550
20.1 統計學習 550
20.2 完整數據下的學習 553
20.2.1 **大似然參數學習:離散模型 553
20.2.2 樸素貝葉斯模型 555
20.2.3 **大似然參數學習:連續模型 555
20.2.4 貝葉斯參數學習 557
20.2.5 學習貝葉斯網路的結構 558
20.3 隱變數學習:EM算法 559
20.3.1 無監督聚類:學習混合高斯分布 560
20.3.2 學習含有隱變數的貝葉斯網路 562
20.3.3 學習隱馬爾可夫模型 563
20.3.4 EM算法的一般形式 564
20.3.5 學習含有隱變數的貝葉斯網路結構 564
20.4 基於實例的學習 565
20.4.1 **近鄰模型 565
20.4.2 核模型 567
20.5 神經元網路 568
20.5.1 神經元網路中的單元 568
20.5.2 網路結構 569
20.5.3 單層前饋神經元網路(感知器) 570
20.5.4 多層前饋神經元網路 573
20.5.5 對神經元網路結構進行學習 576
20.6 核心機 576
20.7 案例分析:手寫體數字識別 579
20.8 小結 580
參考文獻與歷史的注釋 581
習題 584
第 21章 強化學習 587
21.1 介紹 587
21.2 被動強化學習 588
21.2.1 直接效用估計 589
21.2.2 自適應動態規劃 589
21.2.3 時序差分學習 591
21.3 主動強化學習 592
21.3.1 探索 593
21.3.2 學習行動-價值函式 595
21.4 強化學習中的一般化 596
21.4.1 博弈中的套用 599
21.4.2 機器人控制中的套用 599
21.5 策略搜尋 600
21.6 小結 602
參考書目與歷史的注釋 603
習題 605
第七部分 通訊、感知與行動
第 22章 通訊 609
22.1 作為行動的通訊 609
22.1.1 語言的基本原理 610
22.1.2 通訊的組成步驟 611
22.2 部分英語的形式語法 613
22.2.1 E0的詞典 613
22.2.2 E0的語法 614
22.3 句法分析(Parsing) 615
22.4 增強語法 620
22.4.1 動詞的次範疇化 622
22.4.2 增強語法的生成能力 623
22.5 語義解釋 624
22.5.1 部分英語的語義 625
22.5.2 時間和時態 625
22.5.3 量詞限定 626
22.5.4 語用解釋 628
22.5.5 利用DCG生成語言 629
22.6 歧義和排歧 629
22.7 篇章理解 632
22.7.1 指代消解 632
22.7.2 連貫的篇章結構 633
22.8 語法歸納 634
22.9 小結 636
參考文獻與歷史的注釋 636
習題 639
第 23章 機率語言處理 643
23.1 機率語言模型 643
23.1.1 機率的上下文無關語法 645
23.1.2 學習PCFG的機率 646
23.1.3 學習PCFG的規則結構 647
23.2 信息檢索 647
23.2.1 評價IR系統 649
23.2.2 IR的改進方法 650
23.2.3 結果集合的表示 651
23.2.4 IR系統的實現 652
23.3 信息抽取 653
23.4 機器翻譯 655
23.4.1 機器翻譯系統 656
23.4.2 統計機器翻譯 657
23.4.3 機器翻譯的機率學習 659
23.5 小結 660
參考文獻與歷史的注釋 661
習題 663
第 24章 感知 665
24.1 介紹 665
24.2 圖像生成 666
24.2.1 無透鏡成像 針孔照相機 666
24.2.2 透鏡系統 667
24.2.3 光線:成像過程中的光度學特性 668
24.2.4 色彩:成像中的分光譜光度學 669
24.3 初級圖像處理運算 669
24.3.1 邊緣檢測 670
24.3.2 圖像分割 672
24.4 提取三維信息 672
24.4.1 運動 673
24.4.2 雙目立體視覺 675
24.4.3 紋理梯度 677
24.4.4 明暗 677
24.4.5 輪廓 678
24.5 物體識別 681
24.5.1 基於亮度的識別 682
24.5.2 基於特徵的識別 683
24.5.3 姿態估計 685
24.6 利用視覺實現操縱和導航 686
24.7 小結 687
參考文獻與歷史的注釋 688
習題 690
第 25章 機器人學 692
25.1 介紹 692
25.2 機器人硬體 693
25.2.1 感測器 693
25.2.2 效應器 694
25.3 機器人的感知 696
25.3.1 定位 697
25.3.2 繪製地圖 701
25.3.3 其它類型的感知 703
25.4 運動規劃 703
25.4.1 構型空間 704
25.4.2 單元分解方法 706
25.4.3 抽骨架方法 707
25.5 規劃不確定的運動 708
25.6 運動 711
25.6.1 動力學和控制 711
25.6.2 勢場控制 713
25.6.3 反應式控制 714
25.7 機器人軟體體系結構 715
25.7.1 包容體系結構 715
25.7.2 三層體系結構 716
25.7.3 機器人程式設計語言 716
25.8 套用領域 717
25.9 小結 719
參考文獻與歷史的注釋 720
習題 722
第八部分 結論
第 26章 哲學基礎 729
26.1 弱人工智慧:機器能夠智慧型地行動嗎 729
26.1.1 能力缺陷方面的論點 730
26.1.2 數學異議 731
26.1.3 非形式化的論點 732
26.2 強人工智慧:機器能夠真正思考嗎 733
26.2.1 精神-肉體問題 734
26.2.2 “缽中之腦”實驗 735
26.2.3 大腦置換實驗 736
26.2.4 中文屋子 737
26.3 發展人工智慧的道德規範與風險 739
26.4 小結 742
參考文獻與歷史的注釋 742
習題 744
第 27章 人工智慧:現狀與未來 745
27.1 智慧型體的組成部分 745
27.2 智慧型體體系結構 747
27.3 我們在沿著正確的方向前進嗎 748
27.4 如果人工智慧成功了會怎樣 749
附錄A 數學背景 751
A.1 複雜度分析與O()符號 751
A.1.1 漸近分析 751
A.1.2 NP以及固有的難題 752
A.2 向量、矩陣和線性代數 753
A.3 機率分布 754
參考文獻與歷史的注釋 755
附錄B 關於語言和算法的注釋 757
B.1 用巴克斯-諾魯範式(BNF)定義語言 757
B.2 算法的偽代碼描述 757
B.3 在線上幫助 758
參考文獻 (見人民郵電出版社網站)