人工智慧—— 一種現代方法（第二版）

內容簡介

本書以詳盡和豐富的資料，從理性智慧型體的角度，全面闡述了人工智慧領域的跨祝烏核心和店局請內容，並深入介紹了各個主要的研究方向，是一本難得的綜合性教材。全書分為八大部分：第一部分“人工智慧”，第二部分“問題求解”，第三部分“知識與推理”，第四部分“規劃”，第五部分“不確定知識與推棄海狼理”，第六部分“學習”，第七部分“通訊、感知與行動”，第八部分“結論”。

本書既詳細介紹了大量的基本概念、思想和算法，也描述了各研究方向**前沿的進展，同時收集整理了詳實的歷史文獻與事件。因此本書適合於不同層次和領域的研究人員及學生，可以作為信息領域和相關領域的高等院校本科生和研究生的教材或教學輔導書目，也可以作為相關領域的科研與工程技術人員的參考書。

圖書目錄

第一部分　人工智慧

第 1章　緒論　3

1.1　什麼是人工智慧　3

1.1.1　類人行為：圖靈測試方法　4

1.1.2　類人思考：認知模型方法　4

1.1.3　理性地思考：“思維法則”方法　5

1.1.4　理性地行動：理性智慧型體方法　5

1.2　人工智慧的基礎　6

1.2.1　哲學(公元前428年—現在)　6

1.2.2　數學(約800年—現在)　8

1.2.3　經濟學(1776年—現在)　9

1.2.4　神經科學(1861年—現在)　10

1.2.5　心理學(1879年—現在)　11

1.2.6　計算機工程(1940年—現在)　12

1.2.7　控制論(1948年—現在)　13

1.2.8　語言學(1957年—現在)　14

1.3　人工智慧的歷史　14

1.3.1　人工智慧的孕育期(1943年—1955年)　14

1.3.2　人工智慧的誕生(1956年)　15

1.3.3　早期的熱情，巨大的期望(1952年—1969年)　15

1.3.4　現實的困難(1966年—1973年)　17

1.3.5　基於知識的系統：力量的鑰匙?(1969年—1979年)　19

1.3.6　AI成為工業(1980年—現在)　20

1.3.7　神經元網路的回歸(1986年—現在)　20

1.3.8　AI成為科學(1987年—現在)　21

1.3.9　智慧型化智慧型體的出現(1995年—現在)　22

1.4　目前發展水平乃虹恥乎　22

1.5　小結　23

參考文獻與歷史的注釋　24

習題　24

第 2章　智慧型化智慧型體　26

2.1　智慧型體和環境　26

2.2　好的行為表現：理性的概念　28

2.2.1　性能度量　28

2.2.2　理性　28

2.2.3　全知者，學習和自主性　29

2.3　環境的本質　30

2.3.1　詳細說明任務環境　30

2.3.2　任務環境的屬性　32

2.4　智慧型體的結構　35

2.4.1　智慧型體程式　35

2.4.2　簡單眼射型智慧型體　36

2.4.3　基於模型的反射型智慧型體　38

2.4.4　基於目標的智慧型體　39

2.4.5　基於效用的智您駝籃能體　40

2.4.6　學習智慧型體　40

2.5　小結　42

參考文獻與歷史的注釋　42

習題　44

第二部分　問題求解

第3章　用搜尋法對問題求解　49

3.1　問題求解智慧型體　49

3.1.1　定義明確的問題及解　51

3.1.2　把問題形式化　52

3.2　問題實例　53

3.2.1　玩具問題　53

3.2.2　現實世界問題　55

3.3　對解的搜尋　56

3.4　無信息的搜尋策略　59

3.4.1　廣度優先搜尋　59

3.4.2　代價一致搜尋　61

3.4.3　深度優先搜尋　61

3.4.4　深度有限搜尋　62

3.4.5　疊代深入深度優先搜尋　63

3.4.6　雙向搜尋　64

3.4.7　無信息搜尋策略的比較　65

3.5　避免重複狀態　66

3.6　使用不完全信息的搜尋　67

3.6.1　無感測問題　68

3.6.2　偶發性問題　69

3.7　小結　70

參考文獻與歷史的注釋　71

習題　72

第4章　有信息的搜尋和探索　76

4.1　有信息的(啟發式的)搜尋策略　76

4.1.1　貪婪**佳優先搜尋　77

4.1.2　A*搜尋：**小化總的估計解耗散　78

4.1.3　存儲限制的啟發式搜尋　81

4.1.4　為了更好地搜尋而學習　83

4.2　啟發函式　84

4.2.1　啟發函式屑才坑的精確度對性能的影響　85

4.2.2　設計可採納的啟發函式　85

4.2.3　從經驗里踏協學習啟發函式　87

4.3　局部搜尋算法和**最佳化問題　88

4.3.1　爬山法搜尋　88

4.3.2　模擬退火搜尋　91

4.3.3　局部剪枝搜尋　92

4.3.4　遺傳算法　92

4.4　連續空間的局部搜尋　95

4.5　在線上搜尋智慧型體和未知環境　96

4.5.1　在線上搜尋問題　97

4.5.2　在線上搜尋智慧型體　98

4.5.3　在線上局部搜尋　99

4.5.4　在線上搜尋的學習　101

4.6　小結　101

參考文獻與歷史的注釋　102

習題　105

第5章　約束滿足問題　108

5.1　約束滿足問題　108

5.2　CSP問題的回溯搜尋　111

5.2.1　變數和取值順序　112

5.2.2　通過約束傳播信息　113

5.3　約束滿足問題的局部搜尋　117

5.4　問題的結構　118

5.5　小結　120

參考文獻與歷史的注釋　121

習題　123

第6章　對抗搜尋　125

6.1　博弈　125

6.2　博弈中的最佳化決策　126

6.2.1　**優策略　127

6.2.2　極小極大值算法　128

6.2.3　多人遊戲中的**優決策　128

6.3　a-b剪枝　129

6.4　不完整的實時決策　132

6.4.1　評價函式　132

6.4.2　截斷搜尋　134

6.5　包含幾率因素的遊戲　135

6.5.1　有幾率節點的遊戲中的局面評價　137

6.5.2　期望極小極大值的複雜度　137

6.5.3　牌類遊戲　138

6.6　博弈程式的當前發展水平　139

6.7　討論　141

6.8　小結　142

參考文獻與歷史的注釋　143

習題　146

第三部分　知識與推理

第7章　邏輯智慧型體　151

7.1　基於知識的智慧型體　152

7.2　wumpus世界　153

7.3　邏輯　155

7.4　命題邏輯：一種非常簡單的邏輯　158

7.4.1　語法　158

7.4.2　語義　159

7.4.3　一個簡單的知識庫　160

7.4.4　推理　161

7.4.5　等價、合法性和可滿足性　162

7.5　命題邏輯的推理模式　163

7.5.1　歸結　164

7.5.2　合取範式　166

7.5.3　歸結算法　166

7.5.4　歸結的完備性　167

7.5.5　前向和反向連結　168

7.6　有效的命題推理　170

7.6.1　一個完備的回溯搜尋　170

7.6.2　局部搜尋算法　171

7.6.3　困難的滿足性問題　172

7.7　基於命題邏輯的智慧型體　173

7.7.1　用邏輯推理尋找陷阱和wumpus　173

7.7.2　記錄位置和方向　174

7.7.3　基於電路的智慧型體　175

7.7.4　比較　177

7.8　小結　178

參考文獻與歷史的注釋　179

習題　181

第8章　一階邏輯　184

8.1　表示方法的回顧　184

8.2　一階邏輯的語法和語義　187

8.2.1　一階邏輯的模型　187

8.2.2　符號和解釋　188

8.2.3　項　189

8.2.4　原子語句　190

8.2.5　複合語句　190

8.2.6　量詞　190

8.2.7　等式　193

8.3　使用一階邏輯　193

8.3.1　一階邏輯的斷言和查詢　194

8.3.2　親屬關係域　194

8.3.3　數、集合和列表　195

8.3.4　wumpus世界　197

8.4　一階邏輯中的知識工程　199

8.4.1　知識工程的過程　199

8.4.2　電路領域　200

8.5　小結　203

參考文獻與歷史的注釋　203

習題　204

第9章　一階邏輯中的推理　208

9.1　命題與一階推理　208

9.1.1　量詞的推理規則　208

9.1.2　簡化到命題推理　209

9.2　合一和提升　210

9.2.1　一階推理規則　210

9.2.2　合一　211

9.2.3　存儲和檢索　212

9.3　前向連結　214

9.3.1　一階確定子句　214

9.3.2　一個簡單的前向連結算法　215

9.3.3　高效的前向連結　216

9.4　反向連結　219

9.4.1　反向連結算法　219

9.4.2　邏輯程式設計　220

9.4.3　邏輯程式的高效實現　221

9.4.4　冗餘推理和無限循環　223

9.4.5　約束邏輯程式設計　224

9.5　歸結　225

9.5.1　一階邏輯的合取範式　226

9.5.2　歸結推理規則　227

9.5.3　證明的實例　227

9.5.4　歸結的完備性　229

9.5.5　處理等式　231

9.5.6　歸結策略　232

9.5.7　定理證明機　233

9.6　小結　236

參考文獻與歷史的注釋　236

習題　240

第 10章　知識表示　244

10.1　本體論工程　244

10.2　類別和對象　246

10.2.1　物質成份　247

10.2.2　度量　249

10.2.3　物質和對象　249

10.3　行動、情景和事件　250

10.3.1　情景演算本體論　250

10.3.2　描述情景演算中的行動　252

10.3.3　解決表示框架問題　253

10.3.4　解決推理框架問題　254

10.3.5　時間和事件演算　255

10.3.6　一般化事件　255

10.3.7　過程　257

10.3.8　區間　258

10.3.9　流和對象　259

10.4　精神事件和精神對象　260

10.4.1　關於信度的形式理論　260

10.4.2　知識和信度　262

10.4.3　知識、時間和行動　262

10.5　網際網路購物世界　263

10.6　類別的推理系統　267

10.6.1　語義網路　267

10.6.2　描述邏輯　269

10.7　預設信息推理　270

10.7.1　開放世界和封閉世界　270

10.7.2　失敗否定式和穩定模型語義　272

10.7.3　界限和預設邏輯　273

10.8　真值維護系統　275

10.9　小結　276

參考文獻與歷史的注釋　276

習題　281

第四部分　規劃

第 11章　規劃　289

11.1　規劃問題　289

11.1.1　規劃問題語言　290

11.1.2　表達能力和延伸　291

11.1.3　例：航空貨物運輸　292

11.1.4　例：備用輪胎問題　293

11.1.5　例：積木世界　293

11.2　狀態空間搜尋規劃　294

11.2.1　前向狀態空間搜尋　295

11.2.2　後向狀態空間搜尋　296

11.2.3　狀態空間搜尋的啟發式　297

11.3　偏序規劃　298

11.3.1　一個偏序規劃的例子　301

11.3.2　無約束變數的偏序規劃　303

11.3.3　偏序規劃啟發式　303

11.4　規劃圖　304

11.4.1　規劃圖的啟發式估計　305

11.4.2　GRAPHPLAN算法　306

11.4.3　GRAPHPLAN的終止　308

11.5　命題邏輯規劃　309

11.5.1　用命題邏輯描述規劃問題　309

11.5.2　命題編碼的複雜度　311

11.6　規劃方法分析　312

11.7　小結　313

參考文獻與歷史的注釋　314

習題　316

第 12章　現實世界的規劃與行動　320

12.1　時間、調度表和資源　320

12.2　分層任務網路規劃　324

12.2.1　表示行動分解　325

12.2.2　為分解修改規劃器　326

12.2.3　討論　328

12.3　在非確定性領域中進行規劃和行動　329

12.4　條件規劃　331

12.4.1　完全可觀察環境中的條件規劃　331

12.4.2　部分可觀察環境中的條件規劃　334

12.5　執行監控和重新規劃　337

12.6　持續規劃　340

12.7　多智慧型體規劃　343

12.7.1　合作：聯合目標和規劃　344

12.7.2　多體規劃　344

12.7.3　協調機制　346

12.7.4　競爭　347

12.8　小結　347

參考文獻與歷史的注釋　347

習題　350

第五部分　不確定知識與推理

第 13章　不確定性　355

13.1　不確定環境下的行動　355

13.1.1　處理不確定知識　356

13.1.2　不確定性與理性決策　357

13.1.3　決策理論智慧型體的設計　358

13.2　基本機率符號表示　358

13.2.1　命題　358

13.2.2　原子事件　359

13.2.3　先驗機率　360

13.2.4　條件機率　361

13.3　機率公理　362

13.3.1　使用機率公理　363

13.3.2　為什麼機率公理是合理的　363

13.4　使用全聯合分布進行推理　365

13.5　獨立性　367

13.6　貝葉斯法則及其套用　368

13.6.1　套用貝葉斯法則：一個簡單例子　368

13.6.2　使用貝葉斯法則：合併證據　369

13.7　重遊wumpus世界　371

13.8　小結　373

參考文獻與歷史的注釋　374

習題　375

第 14章　機率推理　378

14.1　不確定域中的知識表示　378

14.2　貝葉斯網路的語義　380

14.2.1　表示全聯合機率分布　380

14.2.2　貝葉斯網路中的條件獨立關係　383

14.3　條件分布的有效表達　384

14.4　貝葉斯網路中的精確推理　387

14.4.1　通過枚舉進行推理　387

14.4.2　變數消元算法　389

14.4.3　精確推理的複雜度　391

14.4.4　團算法　392

14.5　貝葉斯網路的近似推理　392

14.5.1　直接採樣算法　392

14.5.2　馬爾可夫鏈仿真推理　396

14.6　把機率擴展到一階表示　398

14.7　不確定推理的其它方法　401

14.7.1　基於規則的不確定推理方法　402

14.7.2　表示無知性：Dempster-Shafer理論　403

14.7.3　表示模糊性：模糊集與模糊邏輯　404

14.8　小結　405

參考文獻與歷史的注釋　406

習題　409

第 15章　關於時間的機率推理　413

15.1　時間與不確定性　413

15.1.1　狀態與觀察　414

15.1.2　穩態過程與馬爾可夫假設　414

15.2　時序模型中的推理　416

15.2.1　濾波和預測　417

15.2.2　平滑　419

15.2.3　尋找**可能序列　421

15.3　隱馬爾可夫模型　422

15.4　卡爾曼濾波器　424

15.4.1　更新高斯分布　425

15.4.2　一個簡單的一維例子　426

15.4.3　一般情況　428

15.4.4　卡爾曼濾波器的適用性　429

15.5　動態貝葉斯網路　430

15.5.1　構造動態貝葉斯網路　430

15.5.2　動態貝葉斯網路中的精確推理　433

15.5.3　動態貝葉斯網路中的近似推理　434

15.6　語音識別　437

15.6.1　語音　438

15.6.2　詞語(word)　440

15.6.3　語句　441

15.6.4　搭建語音識別器　443

15.7　小結　444

參考文獻與歷史的注釋　445

習題　447

第 16章　制定簡單決策　450

16.1　在不確定性環境下結合信度與願望　450

16.2　效用理論基礎　451

16.2.1　理性偏好的約束　451

16.2.2　然後就有了效用　453

16.3　效用函式　453

16.3.1　金錢的效用　454

16.3.2　效用範圍和效用評估　455

16.4　多屬性效用函式　457

16.4.1　優勢　457

16.4.2　偏好結構和多屬性效用　458

16.5　決策網路　460

16.5.1　使用決策網路表示決策問題　460

16.5.2　評價決策網路　461

16.6　信息價值　462

16.6.1　一個簡單例子　462

16.6.2　一個通用公式　462

16.6.3　信息價值的屬性　464

16.6.4　實現信息收集智慧型體　464

16.7　決策理論的專家系統　465

16.8　小結　467

參考文獻與歷史的注釋　467

習題　469

第 17章　制定複雜決策　472

17.1　延續式決策問題　472

17.1.1　一個例子　472

17.1.2　延續式決策問題中的**最佳化　474

17.2　價值疊代　476

17.2.1　狀態效用值　476

17.2.2　價值疊代算法　477

17.2.3　價值疊代的收斂　478

17.3　策略疊代　480

17.4　部分可觀察的MDP　481

17.5　決策理論智慧型體　484

17.6　多智慧型體的決策：博弈論　485

17.7　機制設計　492

17.8　小結　494

參考文獻與歷史的注釋　495

習題　496

第六部分　學習

第 18章　從觀察中學習　501

18.1　學習的形式　501

18.2　歸納學習　502

18.3　學習決策樹　504

18.3.1　作為執行元件的決策樹　504

18.3.2　決策樹的表達能力　505

18.3.3　從實例中歸納決策樹　506

18.3.4　選擇屬性測試　508

18.3.5　評估學習算法的性能　509

18.3.6　噪聲和過擬合　510

18.3.7　擴展決策樹的適用性　512

18.4　集體學習　512

18.5　為什麼學習是可行的：計算學習理論　515

18.5.1　需要多少個實例　516

18.5.2　決策表學習　517

18.5.3　討論　519

18.6　小結　519

參考文獻與歷史的注釋　519

習題　521

第 19章　學習中的知識　524

19.1　學習的邏輯公式　524

19.1.1　實例和假設　524

19.1.2　當前**佳假設搜尋　526

19.1.3　**少約定搜尋　527

19.2　學習中的知識　530

19.2.1　一些簡單的例子　531

19.2.2　一些一般方案　531

19.3　基於解釋的學習　532

19.3.1　從實例中抽取一般規則　533

19.3.2　提高效率　534

19.4　使用相關信息進行學習　535

19.4.1　決定假設空間　536

19.4.2　學習和使用相關性信息　536

19.5　歸納邏輯程式設計　538

19.5.1　一個例子　539

19.5.2　自頂向下的歸納學習方法　541

19.5.3　使用逆向演繹的歸納學習　543

19.5.4　通過歸納邏輯程式設計進行發現　544

19.6　小結　545

參考文獻與歷史的注釋　546

習題　548

第 20章　統計學習方法　550

20.1　統計學習　550

20.2　完整數據下的學習　553

20.2.1　**大似然參數學習：離散模型　553

20.2.2　樸素貝葉斯模型　555

20.2.3　**大似然參數學習：連續模型　555

20.2.4　貝葉斯參數學習　557

20.2.5　學習貝葉斯網路的結構　558

20.3　隱變數學習：EM算法　559

20.3.1　無監督聚類：學習混合高斯分布　560

20.3.2　學習含有隱變數的貝葉斯網路　562

20.3.3　學習隱馬爾可夫模型　563

20.3.4　EM算法的一般形式　564

20.3.5　學習含有隱變數的貝葉斯網路結構　564

20.4　基於實例的學習　565

20.4.1　**近鄰模型　565

20.4.2　核模型　567

20.5　神經元網路　568

20.5.1　神經元網路中的單元　568

20.5.2　網路結構　569

20.5.3　單層前饋神經元網路(感知器)　570

20.5.4　多層前饋神經元網路　573

20.5.5　對神經元網路結構進行學習　576

20.6　核心機　576

20.7　案例分析：手寫體數字識別　579

20.8　小結　580

參考文獻與歷史的注釋　581

習題　584

第 21章　強化學習　587

21.1　介紹　587

21.2　被動強化學習　588

21.2.1　直接效用估計　589

21.2.2　自適應動態規劃　589

21.2.3　時序差分學習　591

21.3　主動強化學習　592

21.3.1　探索　593

21.3.2　學習行動-價值函式　595

21.4　強化學習中的一般化　596

21.4.1　博弈中的套用　599

21.4.2　機器人控制中的套用　599

21.5　策略搜尋　600

21.6　小結　602

參考書目與歷史的注釋　603

習題　605

第七部分　通訊、感知與行動

第 22章　通訊　609

22.1　作為行動的通訊　609

22.1.1　語言的基本原理　610

22.1.2　通訊的組成步驟　611

22.2　部分英語的形式語法　613

22.2.1　E0的詞典　613

22.2.2　E0的語法　614

22.3　句法分析(Parsing)　615

22.4　增強語法　620

22.4.1　動詞的次範疇化　622

22.4.2　增強語法的生成能力　623

22.5　語義解釋　624

22.5.1　部分英語的語義　625

22.5.2　時間和時態　625

22.5.3　量詞限定　626

22.5.4　語用解釋　628

22.5.5　利用DCG生成語言　629

22.6　歧義和排歧　629

22.7　篇章理解　632

22.7.1　指代消解　632

22.7.2　連貫的篇章結構　633

22.8　語法歸納　634

22.9　小結　636

參考文獻與歷史的注釋　636

習題　639

第 23章　機率語言處理　643

23.1　機率語言模型　643

23.1.1　機率的上下文無關語法　645

23.1.2　學習PCFG的機率　646

23.1.3　學習PCFG的規則結構　647

23.2　信息檢索　647

23.2.1　評價IR系統　649

23.2.2　IR的改進方法　650

23.2.3　結果集合的表示　651

23.2.4　IR系統的實現　652

23.3　信息抽取　653

23.4　機器翻譯　655

23.4.1　機器翻譯系統　656

23.4.2　統計機器翻譯　657

23.4.3　機器翻譯的機率學習　659

23.5　小結　660

參考文獻與歷史的注釋　661

習題　663

第 24章　感知　665

24.1　介紹　665

24.2　圖像生成　666

24.2.1　無透鏡成像針孔照相機　666

24.2.2　透鏡系統　667

24.2.3　光線：成像過程中的光度學特性　668

24.2.4　色彩：成像中的分光譜光度學　669

24.3　初級圖像處理運算　669

24.3.1　邊緣檢測　670

24.3.2　圖像分割　672

24.4　提取三維信息　672

24.4.1　運動　673

24.4.2　雙目立體視覺　675

24.4.3　紋理梯度　677

24.4.4　明暗　677

24.4.5　輪廓　678

24.5　物體識別　681

24.5.1　基於亮度的識別　682

24.5.2　基於特徵的識別　683

24.5.3　姿態估計　685

24.6　利用視覺實現操縱和導航　686

24.7　小結　687

參考文獻與歷史的注釋　688

習題　690

第 25章　機器人學　692

25.1　介紹　692

25.2　機器人硬體　693

25.2.1　感測器　693

25.2.2　效應器　694

25.3　機器人的感知　696

25.3.1　定位　697

25.3.2　繪製地圖　701

25.3.3　其它類型的感知　703

25.4　運動規劃　703

25.4.1　構型空間　704

25.4.2　單元分解方法　706

25.4.3　抽骨架方法　707

25.5　規劃不確定的運動　708

25.6　運動　711

25.6.1　動力學和控制　711

25.6.2　勢場控制　713

25.6.3　反應式控制　714

25.7　機器人軟體體系結構　715

25.7.1　包容體系結構　715

25.7.2　三層體系結構　716

25.7.3　機器人程式設計語言　716

25.8　套用領域　717

25.9　小結　719

參考文獻與歷史的注釋　720

習題　722

第八部分　結論

第 26章　哲學基礎　729

26.1　弱人工智慧：機器能夠智慧型地行動嗎　729

26.1.1　能力缺陷方面的論點　730

26.1.2　數學異議　731

26.1.3　非形式化的論點　732

26.2　強人工智慧：機器能夠真正思考嗎　733

26.2.1　精神-肉體問題　734

26.2.2　“缽中之腦”實驗　735

26.2.3　大腦置換實驗　736

26.2.4　中文屋子　737

26.3　發展人工智慧的道德規範與風險　739

26.4　小結　742

參考文獻與歷史的注釋　742

習題　744

第 27章　人工智慧：現狀與未來　745

27.1　智慧型體的組成部分　745

27.2　智慧型體體系結構　747

27.3　我們在沿著正確的方向前進嗎　748

27.4　如果人工智慧成功了會怎樣　749

附錄A　數學背景　751

A.1　複雜度分析與O()符號　751

A.1.1　漸近分析　751

A.1.2　NP以及固有的難題　752

A.2　向量、矩陣和線性代數　753

A.3　機率分布　754

參考文獻與歷史的注釋　755

附錄B　關於語言和算法的注釋　757

B.1　用巴克斯-諾魯範式(BNF)定義語言　757

B.2　算法的偽代碼描述　757

B.3　在線上幫助　758

參考文獻　(見人民郵電出版社網站)

人工智慧—— 一種現代方法（第二版）

基本介紹

內容簡介

圖書目錄

熱門詞條