人工智慧:現代方法(第4版)(精裝版)

人工智慧:現代方法(第4版)(精裝版)

《人工智慧:現代方法(第4版)(精裝版)》是2022年人民郵電出版社出版的圖書,作者是[美]斯圖爾特·羅素(Stuart Russell)。

基本介紹

  • 中文名:人工智慧:現代方法(第4版)(精裝版)
  • 作者:[美]斯圖爾特·羅素(Stuart Russell)
  • 出版時間:2022年12月
  • 出版社:人民郵電出版社
  • ISBN:9787115598110
  • 類別:圖書>計算機/網路>人工智慧>深度學習與神經網路
  • 開本:128 開
  • 裝幀:平裝-膠訂
內容簡介,圖書目錄,作者簡介,

內容簡介

本書全面、深入地探討了人工智慧(AI)領域的理論和實踐,以統一的風格將當今流行的人工智慧思想和術語融合到引起廣泛關注的套用中,真正做到理論和實踐相結合。全書分7個部分,共28章,理論部分介紹了人工智慧研究的主要理論和方法並追溯了兩千多年前的相關思想,內容主要包括邏輯、機率和連續數學,感知、推理、學習和行動,公平、信任、社會公益和安全;實踐部分完美地踐行了“現代”理念,實際套用選擇當下熱度較高的微電子設備、機器人行星探測器、擁有幾十億用戶的線上服務、AlphaZero、人形機器人、自動駕駛、人工智慧輔助醫療等。本書適合作為高等院校人工智慧相關專業本科生和研究生的教材,也可以作為相關領域專業人員的參考書。

圖書目錄

第 一部分 人工智慧基礎
第 1 章 緒論 2
1.1 什麼是人工智慧 2
1.1.1 類人行為:圖靈測試方法 3
1.1.2 類人思考:認知建模方法 3
1.1.3 理性思考:“思維法則”方法 4
1.1.4 理性行為:理性智慧型體方法 4
1.1.5 益機 5
1.2 人工智慧的基礎 6
1.2.1 哲學 6
1.2.2 數學 8
1.2.3 經濟學 9
1.2.4 神經科學 10
1.2.5 心理學 12
1.2.6 計算機工程 13
1.2.7 控制理論與控制論 14
1.2.8 語言學 15
1.3 人工智慧的歷史 16
1.3.1 人工智慧的誕生(1943—1956) 16
1.3.2 早期熱情高漲,期望無限(1952—1969) 17
1.3.3 一些現實(1966—1973) 19
1.3.4 專家系統(1969—1986) 20
1.3.5 神經網路的回歸(1986—現在) 22
1.3.6 機率推理和機器學習(1987—現在) 22
1.3.7 大數據(2001—現在) 23
1.3.8 深度學習(2011—現在) 24
1.4 目前的先進技術 24
1.5 人工智慧的風險和收益 27
小結 30
參考文獻與歷史注釋 31
第 2 章 智慧型體 32
2.1 智慧型體和環境 32
2.2 良好行為:理性的概念 34
2.2.1 性能度量 34
2.2.2 理性 35
2.2.3 全知、學習和自主 36
2.3 環境的本質 37
2.3.1 指定任務環境 37
2.3.2 任務環境的屬性 38
2.4 智慧型體的結構 41
2.4.1 智慧型體程式 41
2.4.2 簡單眼射型智慧型體 42
2.4.3 基於模型的反射型智慧型體 44
2.4.4 基於目標的智慧型體 45
2.4.5 基於效用的智慧型體 46
2.4.6 學習型智慧型體 47
2.4.7 智慧型體程式的組件如何工作 49
小結 50
參考文獻與歷史注釋 51
第二部分 問題求解
第 3 章 通過搜尋進行問題求解 54
3.1 問題求解智慧型體 54
3.1.1 搜尋問題和解 55
3.1.2 問題形式化 56
3.2 問題示例 57
3.2.1 標準化問題 57
3.2.2 真實世界問題 59
3.3 搜尋算法 61
3.3.1 優先搜尋 62
3.3.2 搜尋數據結構 63
3.3.3 冗餘路徑 64
3.3.4 問題求解性能評估 65
3.4 無信息搜尋策略 65
3.4.1 廣度優先搜尋 66
3.4.2 Dijkstra 算法或一致代價搜尋 67
3.4.3 深度優先搜尋與記憶體問題 68
3.4.4 深度受限和疊代加深搜尋 69
3.4.5 雙向搜尋 712
3.4.6 無信息搜尋算法對比 72
3.5 有信息(啟發式)搜尋策略 73
3.5.1 貪心優先搜尋 73
3.5.2 A* 搜尋 75
3.5.3 搜尋等值線 77
3.5.4 滿意搜尋:不可容許的啟發式
函式與加權 A* 搜尋 79
3.5.5 記憶體受限搜尋 80
3.5.6 雙向啟發式搜尋 83
3.6 啟發式函式 85
3.6.1 啟發式函式的準確性對性能的影響 85
3.6.2 從鬆弛問題出發生成啟發式函式 86
3.6.3 從子問題出發生成啟發式函式:模式資料庫 87
3.6.4 使用地標生成啟發式函式 88
3.6.5 學習以更好地搜尋 90
3.6.6 從經驗中學習啟發式函式 90
小結 90
參考文獻與歷史注釋 92
第 4 章 複雜環境中的搜尋 95
4.1 局部搜尋和化問題 95
4.1.1 爬山搜尋 96
4.1.2 模擬退火 98
4.1.3 局部束搜尋 99
4.1.4 進化算法 99
4.2 連續空間中的局部搜尋 102
4.3 使用非確定性動作的搜尋 104
4.3.1 不穩定的真空吸塵器世界 105
4.3.2 與或搜尋樹 106
4.3.3 反覆嘗試 107
4.4 部分可觀測環境中的搜尋 108
4.4.1 無觀測信息的搜尋 108
4.4.2 部分可觀測環境中的搜尋 111
4.4.3 求解部分可觀測問題 112
4.4.4 部分可觀測環境中的智慧型體 113
4.5 線上搜尋智慧型體和未知環境 115
4.5.1 線上搜尋問題 115
4.5.2 線上搜尋智慧型體 117
4.5.3 線上局部搜尋 118
4.5.4 線上搜尋中的學習 119
小結 120
參考文獻與歷史注釋 121
第 5 章 對抗搜尋和博弈 124
5.1 博弈論 124
5.2 博弈中的最佳化決策 126
5.2.1 極小化極大搜尋算法 127
5.2.2 多人博弈中的決策 128
5.2.3 α-β 剪枝 129
5.2.4 移動順序 131
5.3 啟發式 α-β 樹搜尋 132
5.3.1 評價函式 132
5.3.2 截斷搜尋 134
5.3.3 前向剪枝 135
5.3.4 搜尋和查表 136
5.4 蒙特卡羅樹搜尋 136
5.5 隨機博弈 139
5.6 部分可觀測博弈 142
5.6.1 四國軍棋:部分可觀測的西洋棋 142
5.6.2 紙牌遊戲 144
5.7 博弈搜尋算法的局限性 146
小結 147
參考文獻與歷史注釋 148
第 6 章 約束滿足問題 152
6.1 定義約束滿足問題 152
6.1.1 問題示例:地圖著色 153
6.1.2 問題示例:車間作業調度 154
6.1.3 CSP 形式體系的變體 155
6.2 約束傳播:CSP 中的推斷 156
6.2.1 節點一致性 157
6.2.2 弧一致性 157
6.2.3 路徑一致性 158
6.2.4 k 一致性 158
6.2.5 全局約束 159
6.2.6 數獨 160
6.3 CSP 的回溯搜尋 161
6.3.1 變數排序和值排序 163
6.3.2 交替進行搜尋和推理 164
6.3.3 智慧型回溯:向後看 164
6.3.4 約束學習 166
6.4 CSP 的局部搜尋 166
6.5 問題的結構 168
6.5.1 割集調整 169
6.5.2 樹分解 170
6.5.3 值對稱 171
小結 171
參考文獻與歷史注釋 172
第三部分 知識、推理和規劃
第 7 章 邏輯智慧型體 176
7.1 基於知識的智慧型體 176
7.2 wumpus 世界 178
7.3 邏輯 180
7.4 命題邏輯:一種非常簡單的邏輯 183
7.4.1 語法 183
7.4.2 語義 184
7.4.3 一個簡單的知識庫 185
7.4.4 一個簡單的推斷過程 186
7.5 命題定理證明 187
7.5.1 推斷與證明 188
7.5.2 通過歸結證明 190
7.5.3 霍恩子句與確定子句 194
7.5.4 前向連結與反向連結 194
7.6 高效命題模型檢驗 196
7.6.1 完備的回溯算法 196
7.6.2 局部搜尋算法 198
7.6.3 隨機 SAT 問題概覽 199
7.7 基於命題邏輯的智慧型體 200
7.7.1 世界的當前狀態 200
7.7.2 混合智慧型體 203
7.7.3 邏輯狀態估計 204
7.7.4 用命題推斷進行規劃 205
小結 207
參考文獻與歷史注釋 208
第 8 章 一階邏輯 211
8.1 回顧表示 211
8.1.1 思想的語言 212
8.1.2 結合形式語言和自然語言的優點 213
8.2 一階邏輯的語法和語義 215
8.2.1 一階邏輯模型 215
8.2.2 符號與解釋 216
8.2.3 項 218
8.2.4 原子語句 218
8.2.5 複合語句 218
8.2.6 量詞 219
8.2.7 等詞 222
8.2.8 資料庫語義 222
8.3 使用一階邏輯 223
8.3.1 一階邏輯的斷言與查詢 223
8.3.2 親屬關係論域 224
8.3.3 數、集合與列表 225
8.3.4 wumpus 世界 227
8.4 一階邏輯中的知識工程 228
8.4.1 知識工程的過程 229
8.4.2 電子電路論域 230
小結 233
參考文獻與歷史注釋 234
第 9 章 一階邏輯中的推斷 236
9.1 命題推斷與一階推斷 236
9.2 合一與一階推斷 238
9.2.1 合一 239
9.2.2 存儲與檢索 240
9.3 前向連結 241
9.3.1 一階確定子句 242
9.3.2 簡單的前向連結算法 242
9.3.3 高效前向連結 244
9.4 反向連結 247
9.4.1 反向連結算法 247
9.4.2 邏輯編程 248
9.4.3 冗餘推斷和無限循環 249
9.4.4 Prolog 的資料庫語義 251
9.4.5 約束邏輯編程 251
9.5 歸結 252
9.5.1 一階邏輯的合取範式 252
9.5.2 歸結推斷規則 253
9.5.3 證明範例 254
9.5.4 歸結的完備性 256
9.5.5 等詞 258
9.5.6 歸結策略 260
小結 261
參考文獻與歷史注釋 262
第 10 章 知識表示 265
10.1 本體論工程 265
10.2 類別與對象 267
10.2.1 物理組成 268
10.2.2 量度 269
10.2.3 對象:事物和物質 271
10.3 事件 272
10.3.1 時間 273
10.3.2 流和對象 275
10.4 精神對象和模態邏輯 275
10.5 類別的推理系統 278
10.5.1 語義網路 278
10.5.2 描述邏輯 280
10.6 用預設信息推理 281
10.6.1 限定與預設邏輯 281
10.6.2 真值維護系統 283
小結 284
參考文獻與歷史注釋 285
第 11 章 自動規劃 290
11.1 經典規劃的定義 290
11.1.1 範例領域:航空貨物運輸 291
11.1.2 範例領域:備用輪胎問題 292
11.1.3 範例領域:積木世界 292
11.2 經典規劃的算法 294
11.2.1 規劃的前向狀態空間搜尋 294
11.2.2 規劃的反向狀態空間搜尋 295
11.2.3 使用布爾可滿足性規劃 296
11.2.4 其他經典規劃方法 296
11.3 規劃的啟發式方法 297
11.3.1 領域無關剪枝 299
11.3.2 規劃中的狀態抽象 300
11.4 分層規劃 300
11.4.1 高層動作 301
11.4.2 搜尋基元解 302
11.4.3 搜尋抽象解 303
11.5 非確定性域的規劃和行動 307
11.5.1 無感測器規劃 309
11.5.2 應變規劃 312
11.5.3 線上規劃 313
11.6 時間、調度和資源 315
11.6.1 時間約束和資源約束的表示 315
11.6.2 解決調度問題 316
11.7 規劃方法分析 318
小結 319
參考文獻與歷史注釋 320
第四部分 不確定知識和不確定推理
第 12 章 不確定性的量化 326
12.1 不確定性下的動作 326
12.1.1 不確定性概述 327
12.1.2 不確定性與理性決策 328
12.2 基本機率記號 329
12.2.1 機率是關於什麼的 329
12.2.2 機率斷言中的命題語言 330
12.2.3 機率公理及其合理性 333
12.3 使用完全聯合分布進行推斷 334
12.4 獨立性 336
12.5 貝葉斯法則及其套用 337
12.5.1 套用貝葉斯法則:簡單實例 338
12.5.2 套用貝葉斯法則:合併證據 339
12.6 樸素貝葉斯模型 340
12.7 重遊 wumpus 世界 342
小結 344
參考文獻與歷史注釋 345
第 13 章 機率推理 348
13.1 不確定域的知識表示 348
13.2 貝葉斯網路的語義 350
13.2.1 貝葉斯網路中的條件獨立性關係 353
13.2.2 條件分布的高效表示 354
13.2.3 連續變數的貝葉斯網路 356
13.2.4 案例研究:汽車保險 358
13.3 貝葉斯網路中的精確推斷 360
13.3.1 通過枚舉進行推斷 361
13.3.2 變數消元算法 363
13.3.3 精確推斷的複雜性 365
13.3.4 聚類算法 366
13.4 貝葉斯網路中的近似推理 367
13.4.1 直接採樣方法 368
13.4.2 通過馬爾可夫鏈模擬進行推斷 372
13.4.3 編譯近似推斷 378
13.5 因果網路 379
13.5.1 表示動作:do 操作 380
13.5.2 後門準則 382
小結 382
參考文獻與歷史注釋 383
第 14 章 時間上的機率推理 388
14.1 時間與不確定性 388
14.1.1 狀態與觀測 389
14.1.2 轉移模型與感測器模型 389
14.2 時序模型中的推斷 391
14.2.1 濾波與預測 392
14.2.2 平滑 394
14.2.3 尋找可能序列 396
14.3 隱馬爾可夫模型 398
14.3.1 簡化矩陣算法 398
14.3.2 隱馬爾可夫模型示例:定位 400
14.4 卡爾曼濾波器 403
14.4.1 更新高斯分布 403
14.4.2 簡單的一維示例 404
14.4.3 一般情況 406
14.4.4 卡爾曼濾波的適用範圍 407
14.5 動態貝葉斯網路 408
14.5.1 構建動態貝葉斯網路 409
14.5.2 動態貝葉斯網路中的精確推斷 412
14.5.3 動態貝葉斯網路中的近似推斷 413
小結 417
參考文獻與歷史注釋 418
第 15 章 機率編程 421
15.1 關係機率模型 421
15.1.1 語法與語義 423
15.1.2 實例:評定玩家的技能等級 425
15.1.3 關係機率模型中的推斷 426
15.2 開宇宙機率模型 427
15.2.1 語義與語法 428
15.2.2 開宇宙機率模型的推斷 429
15.2.3 示例 430
15.3 追蹤複雜世界 433
15.3.1 示例:多目標跟蹤 433
15.3.2 示例:交通監控 436
15.4 作為機率模型的程式 436
15.4.1 示例:文本閱讀 437
15.4.2 語法與語義 438
15.4.3 推斷結果 438
15.4.4 結合馬爾可夫模型改進生成程式 439
15.4.5 生成程式的推斷 439
小結 440
參考文獻與歷史注釋 440
第 16 章 做簡單決策 444
16.1 在不確定性下結合信念與願望 444
16.2 效用理論基礎 445
16.2.1 理性偏好的約束 445
16.2.2 理性偏好導致效用 447
16.3 效用函式 448
16.3.1 效用評估和效用尺度 448
16.3.2 金錢的效用 449
16.3.3 期望效用與決策後失望 451
16.3.4 人類判斷與非理性 452
16.4 多屬性效用函式 454
16.4.1 占優 455
16.4.2 偏好結構與多屬性效用 456
16.5 決策網路 458
16.5.1 使用決策網路表示決策問題 458
16.5.2 評估決策網路 460
16.6 信息價值 460
16.6.1 簡單示例 460
16.6.2 完美信息的一般公式 461
16.6.3 價值信息的性質 462
16.6.4 信息收集智慧型體的實現 463
16.6.5 非短視信息收集 463
16.6.6 敏感性分析與健壯決策 464
16.7 未知偏好 465
16.7.1 個人偏好的不確定性 466
16.7.2 順從人類 467
小結 468
參考文獻與歷史注釋 469
第 17 章 做複雜決策 473
17.1 序貫決策問題 473
17.1.1 時間上的效用 475
17.1.2 策略與狀態效用 477
17.1.3 獎勵規模 479
17.1.4 表示 MDP 480
17.2 MDP 的算法 482
17.2.1 價值疊代 482
17.2.2 策略疊代 485
17.2.3 線性規劃 487
17.2.4 MDP 的線上算法 487
17.3 老虎機問題 489
17.3.1 計算基廷斯指數 491
17.3.2 伯努利老虎機 492
17.3.3 近似老虎機策略 493
17.3.4 不可索引變體 493
17.4 部分可觀測MDP 495
17.5 求解POMDP 的算法 497
17.5.1 POMDP的價值疊代 497
17.5.2 POMDP的線上算法 500
小結 501
參考文獻與歷史注釋 502
第 18 章 多智慧型體決策 505
18.1 多智慧型體環境的特性 505
18.1.1 單個決策者 505
18.1.2 多決策者 506
18.1.3 多智慧型體規劃 507
18.1.4 多智慧型體規劃:合作與協調 509
18.2 非合作博弈論 510
18.2.1 單步博弈:正則形式博弈 510
18.2.2 社會福利 513
18.2.3 重複博弈 517
18.2.4 序貫博弈:擴展形式 520
18.2.5 不確定收益與輔助博弈 525
18.3 合作博弈論 527
18.3.1 聯盟結構與結果 528
18.3.2 合作博弈中的策略 529
18.3.3 合作博弈中的計算 531
18.4 制定集體決策 533
18.4.1 在契約網中分配任務 533
18.4.2 通過拍賣分配稀缺資源 535
18.4.3 投票 539
18.4.4 議價 541
小結 544
參考文獻與歷史注釋 545
第五部分 機器學習
第 19 章 樣例學習 550
19.1 學習的形式 550
19.2 監督學習 552
19.3 決策樹學習 555
19.3.1 決策樹的表達能力 556
19.3.2 從樣例中學習決策樹 557
19.3.3 選擇測試屬性 559
19.3.4 泛化與過擬合 560
19.3.5 拓展決策樹的適用範圍 562
19.4 模型選擇與模型最佳化 563
19.4.1 模型選擇 564
19.4.2 從錯誤率到損失函式 566
19.4.3 正則化 567
19.4.4 超參數調整 568
19.5 學習理論 569
19.6 線性回歸與分類 572
19.6.1 單變數線性回歸 572
19.6.2 梯度下降 574
19.6.3 多變數線性回歸 575
19.6.4 帶有硬閾值的線性分類器 577
19.6.5 基於邏輯斯諦回歸的線性分類器 579
19.7 非參數模型 581
19.7.1 近鄰模型 581
19.7.2 使用 k-d 樹尋找近鄰 583
19.7.3 局部敏感哈希 584
19.7.4 非參數回歸 585
19.7.5 支持向量機 586
19.7.6 核技巧 589
19.8 集成學習 589
19.8.1 自助聚合法 590
19.8.2 隨機森林法 590
19.8.3 堆疊法 591
19.8.4 自適應提升法 592
19.8.5 梯度提升法 594
19.8.6 線上學習 595
19.9 開發機器學習系統 596
19.9.1 問題形式化 596
19.9.2 數據收集、評估和管理 597
19.9.3 模型選擇與訓練 601
19.9.4 信任、可解釋性、可說明性 601
19.9.5 操作、監控和維護 603
小結 604
參考文獻與歷史注釋 605
第 20 章 機率模型學習 610
20.1 統計學習 610
20.2 完全數據學習 613
20.2.1 似然參數學習:離散模型 613
20.2.2 樸素貝葉斯模型 615
20.2.3 生成模型和判別模型 616
20.2.4 似然參數學習:連續模型 616
20.2.5 貝葉斯參數學習 618
20.2.6 貝葉斯線性回歸 620
20.2.7 貝葉斯網路結構學習 622
20.2.8 非參數模型密度估計 623
20.3 隱變數學習:EM 算法 624
20.3.1 無監督聚類:學習混合高斯 625
20.3.2 學習帶隱變數的貝葉斯網路參數值 627
20.3.3 學習隱馬爾可夫模型 630
20.3.4 EM 算法的一般形式 630
20.3.5 學習帶隱變數的貝葉斯網路結構 631
小結 632
參考文獻與歷史注釋 632
第 21 章 深度學習 635
21.1 簡單前饋網路 636
21.1.1 網路作為複雜函式 636
21.1.2 梯度與學習 639
21.2 深度學習的計算圖 640
21.2.1 輸入編碼 641
21.2.2 輸出層與損失函式 641
21.2.3 隱藏層 642
21.3 卷積網路 643
21.3.1 池化與下採樣 646
21.3.2 卷積神經網路的張量運算 646
21.3.3 殘差網路 647
21.4 學習算法 648
21.4.1 計算圖中的梯度計算 649
21.4.2 批量歸一化 650
21.5 泛化 650
21.5.1 選擇正確的網路架構 651
21.5.2 神經架構搜尋 652
21.5.3 權重衰減 653
21.5.4 暫退法 653
21.6 循環神經網路 654
21.6.1 訓練基本的循環神經網路 655
21.6.2 長短期記憶 RNN 656
21.7 無監督學習與遷移學習 657
21.7.1 無監督學習 657
21.7.2 遷移學習和多任務學習 661
21.8 套用 662
21.8.1 視覺 662
21.8.2 自然語言處理 663
21.8.3 強化學習 663
小結 664
參考文獻與歷史注釋 664
第 22 章 強化學習 668
22.1 從獎勵中學習 668
22.2 被動強化學習 670
22.2.1 直接效用估計 671
22.2.2 自適應動態規劃 671
22.2.3 時序差分學習 672
22.3 主動強化學習 674
22.3.1 探索 675
22.3.2 安全探索 677
22.3.3 時序差分 Q 學習 678
22.4 強化學習中的泛化 680
22.4.1 近似直接效用估計 680
22.4.2 近似時序差分學習 681
22.4.3 深度強化學習 682
22.4.4 獎勵函式設計 683
22.4.5 分層強化學習 683
22.5 策略搜尋 686
22.6 學徒學習與逆強化學習 688
22.7 強化學習的套用 690
22.7.1 在電子遊戲中的套用 690
22.7.2 在機器人控制中的套用 691
小結 692
參考文獻與歷史注釋 693
第六部分 溝通、感知和行動
第 23 章 自然語言處理 698
23.1 語言模型 698
23.1.1 詞袋模型 699
23.1.2 n 元單詞模型 700
23.1.3 其他 n 元模型 701
23.1.4 n 元模型的平滑 701
23.1.5 單詞表示 702
23.1.6 詞性標註 703
23.1.7 語言模型的比較 706
23.2 文法 707
23.3 句法分析 709
23.3.1 依存分析 711
23.3.2 從樣例中學習句法分析器 712
23.4 擴展文法 713
23.4.1 語義解釋 715
23.4.2 學習語義文法 717
23.5 真實自然語言的複雜性 717
23.6 自然語言任務 720
小結 722
參考文獻與歷史注釋 722
第 24 章 自然語言處理中的深度學習 727
24.1 詞嵌入 727
24.2 自然語言處理中的循環神經網路 730
24.2.1 使用循環神經網路的語言模型 730
24.2.2 用循環神經網路進行分類 732
24.2.3 自然語言處理任務中的 LSTM模型 733
24.3 序列到序列模型 733
24.3.1 注意力 735
24.3.2 解碼 736
24.4 Transformer 架構 737
24.4.1 自注意力 737
24.4.2 從自注意力到 Transformer 738
24.5 預訓練和遷移學習 739
24.5.1 預訓練詞嵌入 740
24.5.2 預訓練上下文表示 741
24.5.3 掩碼語言模型 742
24.6 水平(SOTA) 742
小結 745
參考文獻與歷史注釋 745
第 25 章 計算機視覺 748
25.1 引言 748
25.2 圖像形成 749
25.2.1 無透鏡成像:針孔照相機 749
25.2.2 透鏡系統 751
25.2.3 縮放正交投影 752
25.2.4 光線與明暗 752
25.2.5 顏色 753
25.3 簡單圖像特徵 754
25.3.1 邊緣 755
25.3.2 紋理 757
25.3.3 光流 758
25.3.4 自然圖像分割 759
25.4 圖像分類 760
25.4.1 基於卷積神經網路的圖像分類 761
25.4.2 卷積神經網路對圖像分類問題
有效的原因 762
25.5 物體檢測 763
25.6 三維世界 766
25.6.1 多個視圖下的三維線索 766
25.6.2 雙目立體視覺 766
25.6.3 移動攝像機給出的三維線索 768
25.6.4 單個視圖的三維線索 769
25.7 計算機視覺的套用 769
25.7.1 理解人類行為 770
25.7.2 匹配圖片與文字 772
25.7.3 多視圖重建 773
25.7.4 單視圖中的幾何 774
25.7.5 生成圖片 775
25.7.6 利用視覺控制運動 778
小結 780
參考文獻與歷史注釋 781
第 26 章 機器人學 785
26.1 機器人 785
26.2 機器人硬體 786
26.2.1 機器人的硬體層面分類 786
26.2.2 感知世界 787
26.2.3 產生運動 789
26.3 機器人學解決哪些問題 789
26.4 機器人感知 790
26.4.1 定位與地圖構建 791
26.4.2 其他感知類型 795
26.4.3 機器人感知中的監督學習與無監督學習 795
26.5 規劃與控制 796
26.5.1 構形空間 796
26.5.2 運動規劃 799
26.5.3 軌跡跟蹤控制 806
26.5.4 控制 809
26.6 規劃不確定的運動 810
26.7 機器人學中的強化學習 812
26.7.1 利用模型 812
26.7.2 利用其他信息 813
26.8 人類與機器人 814
26.8.1 協調 814
26.8.2 學習做人類期望的事情 817
26.9 其他機器人框架 820
26.9.1 反應式控制器 820
26.9.2 包容架構 821
26.10 套用領域 822
小結 825
參考文獻與歷史注釋 826
第七部分 總結
第 27 章 人工智慧的哲學、倫理和安全性 832
27.1 人工智慧的極限 832
27.1.1 由非形式化得出的論據 832
27.1.2 由能力缺陷得出的論據 833
27.1.3 數學異議 833
27.1.4 衡量人工智慧 834
27.2 機器能真正地思考嗎 835
27.2.1 中文房間 835
27.2.2 意識與感質 836
27.3 人工智慧的倫理 836
27.3.1 致命性自主武器 837
27.3.2 監控、安全與隱私 839
27.3.3 公平與偏見 841
27.3.4 信任與透明度 844
27.3.5 工作前景 845
27.3.6 機器人權利 847
27.3.7 人工智慧安全性 848
小結 851
參考文獻與歷史注釋 852
第 28 章 人工智慧的未來 857
28.1 人工智慧組件 857
28.2 人工智慧架構 862
附錄 A 數學背景知識 865
附錄 B 關於語言與算法的說明 871
參考文獻 873
索引 914

作者簡介

斯圖爾特·羅素(Stuart Russell),1986年他進入加利福尼亞大學伯克利分校,任計算機科學系教授,並曾擔任系主任,人類兼容人工智慧中心主任,他也是史密斯?C扎德(Smith-Zadeh)工程系講席教授。1990年,他獲得了美國國家科學基金會(NSF)傑出青年科學家總統獎;1995年,他成為計算機與思想獎的獲獎人之一。他是美國人工智慧協會(AAAI)、美國計算機協會(ACM)和美國科學促進協會的會士,牛津大學瓦德漢學院的榮譽院士和安德魯·卡內基(Andrew Carnegie)院士。2012年到2014年,他在巴黎擔任布萊斯·帕斯卡(Blaise Pascal)主席。他在人工智慧領域發表了300多篇論文,涉及範圍廣泛。
彼得·諾維格(Peter Norvig)曾任谷歌公司的研究總監、核心網路搜尋算法的負責人。他曾與他人合作共同教授了一門有16萬名學生註冊的線上人工智慧課程,幫助開啟了當下的大規模線上公開課程的大幕。他曾擔任美國宇航局艾姆斯研究中心計算科學部的負責人,負責人工智慧和機器人學的研究和開發。他曾任南加利福尼亞大學的教授和加利福尼亞大學伯克利分校、史丹福大學的教師。他是美國人工智慧協會和美國計算機協會的會士,以及美國藝術與科學院和加利福尼亞科學院的院士。
兩位作者共同獲得了2016年首屆AAAI EAAI傑出教育家獎。

相關詞條

熱門詞條

聯絡我們