統計學習方法（第2版）

統計學習方法（第2版）

《統計學習方法（第2版）》是2019年清華大學出版社出版的圖書，作者是李航。

基本介紹

中文名：統計學習方法（第2版）
作者：李航
出版時間：2019年5月1日
出版社：清華大學出版社
ISBN：9787302517276
定價：98 元

內容簡介,圖書目錄,

內容簡介

本書全面系統地介紹了統計學習的主要方法，共分兩篇。第一篇系統介紹監督學習的各種重要方法，包括決策樹、感知機、支持向量機、最大熵模型與邏輯斯諦回歸、推進法、多類分類法、EM算法、隱馬爾科夫模型和條件隨機場等；第二篇介紹無監督學習，包括聚類、奇異值、主成分分析、潛在語義分析等。兩篇中，除概論和總結外，每章介紹一或二種方法。

圖書目錄

第1篇監督學習

第 1章統計學習及監督學習概論 . 3

1.1統計學習 . 3

1.2統計學習的分類 . 5

1.2.1基本分類 . 6

1.2.2按模型分類 11

1.2.3按算法分類 13

1.2.4按技巧分類 13

1.3統計學習方法三要素 15

1.3.1模型 15

1.3.2策略 16

1.3.3算法 19

1.4模型評估與模型選擇 19

1.4.1訓練誤差與測試誤差 19

1.4.2過擬合與模型選擇 20

1.5正則化與交叉驗證 23

1.5.1正則化 23

1.5.2交叉驗證 . 24

1.6泛化能力 . 24

1.6.1泛化誤差 . 24

1.6.2泛化誤差上界 25

1.7生成模型與判別模型 27

1.8監督學習套用 28

1.8.1分類問題 . 28

1.8.2標註問題 . 30

1.8.3回歸問題 . 32

本章概要 33

繼續閱讀 33

習題 33

參考文獻 34

第 2章感知機 35

2.1感知機模型 35

2.2感知機學習策略 . 36

2.2.1數據集的線性可分性 36

2.2.2感知機學習策略 . 37

2.3感知機學習算法 . 38

2.3.1感知機學習算法的原始形式 38

2.3.2算法的收斂性 41 ...

2.3.3感知機學習算法的對偶形式43

本章概要46

繼續閱讀46

習題46

參考文獻47

第3章k近鄰法49

3.1k近鄰算法49

3.2k近鄰模型50

3.2.1模型50

3.2.2距離度量.50

3.2.3k值的選擇52

3.2.4分類決策規則52

3.3k近鄰法的實現：kd樹.53

3.3.1構造kd樹.53

3.3.2搜尋kd樹.55

本章概要57

繼續閱讀57

習題58

參考文獻58

第4章樸素貝葉斯法59

4.1樸素貝葉斯法的學習與分類59

4.1.1基本方法.59

4.1.2後驗機率最大化的含義.61

4.2樸素貝葉斯法的參數估計62

4.2.1極大似然估計62

4.2.2學習與分類算法.62

4.2.3貝葉斯估計64

本章概要65

繼續閱讀66

習題66

參考文獻66

第5章決策樹67

5.1決策樹模型與學習67

5.1.1決策樹模型67

5.1.2決策樹與if-then規則.68

5.1.3決策樹與條件機率分布.68

5.1.4決策樹學習69

5.2特徵選擇.71

5.2.1特徵選擇問題71

5.2.2信息增益.72

5.2.3信息增益比76

5.3決策樹的生成76

5.3.1ID3算法.76

5.3.2C4.5的生成算法78

5.4決策樹的剪枝78

5.5CART算法.80

5.5.1CART生成.81

5.5.2CART剪枝.85

本章概要87

繼續閱讀88

習題89

參考文獻89

第6章邏輯斯諦回歸與最大熵模型91

6.1邏輯斯諦回歸模型91

6.1.1邏輯斯諦分布91

6.1.2二項邏輯斯諦回歸模型.92

6.1.3模型參數估計93

6.1.4多項邏輯斯諦回歸94

6.2最大熵模型94

6.2.1最大熵原理94

6.2.2最大熵模型的定義96

6.2.3最大熵模型的學習98

6.2.4極大似然估計.102

6.3模型學習的最最佳化算法103

6.3.1改進的疊代尺度法.103

6.3.2擬牛頓法107

本章概要.108

繼續閱讀.109

習題.109

參考文獻.109

第7章支持向量機111

7.1線性可分支持向量機與硬間隔最大化112

7.1.1線性可分支持向量機.112

7.1.2函式間隔和幾何間隔.113

7.1.3間隔最大化.115

7.1.4學習的對偶算法120

7.2線性支持向量機與軟間隔最大化.125

7.2.1線性支持向量機125

7.2.2學習的對偶算法127

7.2.3支持向量130

7.2.4合頁損失函式.131

7.3非線性支持向量機與核函式.133

7.3.1核技巧.133

7.3.2正定核.136

7.3.3常用核函式.140

7.3.4非線性支持向量分類機141

7.4序列最小最最佳化算法.142

7.4.1兩個變數二次規劃的求解方法143

7.4.2變數的選擇方法147

7.4.3SMO算法149

本章概要.149

繼續閱讀.152

習題.152

參考文獻.153

第8章提升方法155

8.1提升方法AdaBoost算法.155

8.1.1提升方法的基本思路.155

8.1.2AdaBoost算法.156

8.1.3AdaBoost的例子158

8.2AdaBoost算法的訓練誤差分析160

8.3AdaBoost算法的解釋.162

8.3.1前向分步算法.162

8.3.2前向分步算法與AdaBoost.164

8.4提升樹.166

8.4.1提升樹模型.166

8.4.2提升樹算法.166

8.4.3梯度提升170

本章概要.172

繼續閱讀.172

習題.173

參考文獻.173

第9章EM算法及其推廣.175

9.1EM算法的引入175

9.1.1EM算法175

9.1.2EM算法的導出179

9.1.3EM算法在無監督學習中的套用.181

9.2EM算法的收斂性.181

9.3EM算法在高斯混合模型學習中的套用.183

9.3.1高斯混合模型.183

9.3.2高斯混合模型參數估計的EM算法.183

9.4EM算法的推廣187

9.4.1F函式的極大-極大算法.187

9.4.2GEM算法189

本章概要.191

繼續閱讀.192

習題.192

參考文獻.192

第10章隱馬爾可夫模型193

10.1隱馬爾可夫模型的基本概念193

10.1.1隱馬爾可夫模型的定義193

10.1.2觀測序列的生成過程196

10.1.3隱馬爾可夫模型的3個基本問題.196

10.2機率計算算法197

10.2.1直接計算法.197

10.2.2前向算法198

10.2.3後向算法201

10.2.4一些機率與期望值的計算.202

10.3學習算法203

10.3.1監督學習方法203

10.3.2Baum-Welch算法.204

10.3.3Baum-Welch模型參數估計公式.206

10.4預測算法207

10.4.1近似算法208

10.4.2維特比算法.208

本章概要.212

繼續閱讀.212

習題.213

參考文獻.213

第11章條件隨機場215

11.1機率無向圖模型215

11.1.1模型定義215

11.1.2機率無向圖模型的因子分解217

11.2條件隨機場的定義與形式.218

11.2.1條件隨機場的定義.218

11.2.2條件隨機場的參數化形式.220

11.2.3條件隨機場的簡化形式221

11.2.4條件隨機場的矩陣形式223

11.3條件隨機場的機率計算問題224

11.3.1前向-後向算法.225

11.3.2機率計算225

11.3.3期望值的計算226

11.4條件隨機場的學習算法227

11.4.1改進的疊代尺度法.227

11.4.2擬牛頓法230

11.5 條件隨機場的預測算法231

本章概要.235

繼續閱讀.235

習題.236

參考文獻.236

第12章監督學習方法總結237

第2篇無監督學習

第13章無監督學習概論245

13.1無監督學習基本原理245

13.2基本問題246

13.3機器學習三要素249

13.4 無監督學習方法249

本章概要.253

繼續閱讀.254

參考文獻.254

第14章聚類方法255

14.1聚類的基本概念255

14.1.1相似度或距離255

14.1.2類或簇258

14.1.3類與類之間的距離.260

14.2層次聚類261

14.3k均值聚類.263

14.3.1模型.263

14.3.2策略.263

14.3.3算法.264

14.3.4算法特性266

本章概要.267

繼續閱讀.268

習題.269

參考文獻.269

第15章奇異值分解271

15.1奇異值分解的定義與性質.271

15.1.1定義與定理.271

15.1.2緊奇異值分解與截斷奇異值分解.276

15.1.3幾何解釋279

15.1.4主要性質280

15.2奇異值分解的計算.282

15.3奇異值分解與矩陣近似286

15.3.1弗羅貝尼烏斯範數.286

15.3.2矩陣的最優近似287

15.3.3矩陣的外積展開式.290

本章概要.292

繼續閱讀.294

習題.294

參考文獻.295

第16章主成分分析297

16.1總體主成分分析297

16.1.1基本想法297

16.1.2定義和導出.299

16.1.3主要性質301

16.1.4主成分的個數306

16.1.5規範化變數的總體主成分.309

16.2樣本主成分分析310

16.2.1樣本主成分的定義和性質.310

16.2.2相關矩陣的特徵值分解算法312

16.2.3數據矩陣的奇異值分解算法315

本章概要.317

繼續閱讀.319

習題.320

參考文獻.320

第17章潛在語義分析.321

17.1單詞向量空間與話題向量空間321

17.1.1單詞向量空間321

17.1.2話題向量空間324

17.2潛在語義分析算法.327

17.2.1矩陣奇異值分解算法327

17.2.2例子.329

17.3非負矩陣分解算法.331

17.3.1非負矩陣分解331

17.3.2潛在語義分析模型.332

17.3.3非負矩陣分解的形式化332

17.3.4算法.333

本章概要.335

繼續閱讀.337

習題.337

參考文獻.337

第18章機率潛在語義分析339

18.1機率潛在語義分析模型339

18.1.1基本想法339

18.1.2生成模型340

18.1.3共現模型341

18.1.4模型性質342

18.2 機率潛在語義分析的算法.345

本章概要.347

繼續閱讀.348

習題.348

參考文獻.349

第19章馬爾可夫鏈蒙特卡羅法351

19.1蒙特卡羅法.351

19.1.1隨機抽樣351

19.1.2數學期望估計353

19.1.3積分計算353

19.2馬爾可夫鏈.355

19.2.1基本定義355

19.2.2離散狀態馬爾可夫鏈356

19.2.3連續狀態馬爾可夫鏈362

19.2.4馬爾可夫鏈的性質.363

19.3馬爾可夫鏈蒙特卡羅法367

19.3.1基本想法367

19.3.2基本步驟369

19.3.3馬爾可夫鏈蒙特卡羅法與統計學習369

19.4Metropolis-Hastings算法.370

19.4.1基本原理370

19.4.2Metropolis-Hastings算法.373

19.4.3單分量Metropolis-Hastings算法374

19.5吉布斯抽樣.375

19.5.1基本原理376

19.5.2吉布斯抽樣算法377

19.5.3抽樣計算378

本章概要.379

繼續閱讀.381

習題.381

參考文獻.383

第20章潛在狄利克雷分配385

20.1狄利克雷分布385

20.1.1分布定義385

20.1.2共軛先驗389

20.2潛在狄利克雷分配模型390

20.2.1基本想法390

20.2.2模型定義391

20.2.3機率圖模型.393

20.2.4隨機變數序列的可交換性.394

20.2.5機率公式395

20.3LDA的吉布斯抽樣算法.396

20.3.1基本想法396

20.3.2算法的主要部分397

20.3.3算法的後處理399

20.3.4算法.399

20.4LDA的變分EM算法401

20.4.1變分推理401

20.4.2變分EM算法.403

20.4.3算法推導404

20.4.4算法總結411

本章概要.411

繼續閱讀.413

習題.413

參考文獻.413

第21章PageRank算法415

21.1PageRank的定義415

21.1.1基本想法415

21.1.2有向圖和隨機遊走模型416

21.1.3PageRank的基本定義.418

21.1.4PageRank的一般定義.421

21.2PageRank的計算423

21.2.1疊代算法423

21.2.2冪法.425

21.2.3代數算法430

本章概要.430

繼續閱讀.432

習題.432

參考文獻.432

第22章無監督學習方法總結.435

22.1無監督學習方法的關係和特點435

22.1.1各種方法之間的關係435

22.1.2無監督學習方法436

22.1.3基礎機器學習方法.437

22.2 話題模型之間的關係和特點437

參考文獻.438

附錄A梯度下降法439

附錄B牛頓法和擬牛頓法.441

附錄C拉格朗日對偶性447

附錄D矩陣的基本子空間451

附錄EKL散度的定義和狄利克雷分布的性質.455

索引.457

相關詞條

熱門詞條

聯絡我們