圖說圖解機器學習

圖說圖解機器學習

《圖說圖解機器學習》是2019年7月電子工業出版社出版的圖書,作者是耿煜。

基本介紹

  • 書名:圖說圖解機器學習
  • 作者:耿煜
  • 出版社:電子工業出版社
  • 出版時間:2019年7月
  • 頁數:220 頁
  • 定價:56 元
  • 開本:16 開
  • ISBN:9787121368264
內容簡介,目錄,

內容簡介

書採用圖形化的方法講解人工智慧和機器學習的知識與技術,並且借用圖夜嚷夜抹形拳喇笑化軟體KNIME採用拖、拉、拽等“傻瓜式”的操作完成從簡單到複雜的機器學習項目。全書分為三個部分,分別是人工智慧技術入門、傳統機器學習和深度學習。
本書具有圖說圖解、自上而下、夠用即止、實戰掌握的特點,適合於作為人工智慧入門者、人工智慧技術套用者及高職高專院校理工科、本科院校非理工科專業學生的教材。

目錄

第1章 人工智慧及機器學習概述...................................1
1.1 人工智慧概述 ............................................................................1
1.1.1.人工智慧簡史...............................................................2
1.1.2.人工智慧是什麼...........................................................4
1.1.3.人工智慧的能力...........................................................5
1.2 機器學習概述燥鞏應 ............................................................................5
1.2.1.機器學習是什麼...........................................................5
1.2.2.以監督學習為例...........................................................6
1.2.3.學習任務......................................................................7
1.2.4.機器學習要解決的基本問題.......................................7
1.2.5.機器淋朽立學習如何設記最佳化模型...............................................7
1.2.6.機奔譽洪歡器學習工作流程.......................................................7
1.2.7.機器學習的各大流派...................................................8
1.2.8.機器學習算法選擇.......................................................8
1.2.9.需要的知識...................................................................9
1.3 深度學習概述 ............................................................................9
1.4 機器學習與統計學 ....................................................................9
1.5 課後練習 ..................................................................................10
第2章 機器學習基礎知識...........................................11
2.1 數學基礎 ..................................................................................11
2.1.1.數據的套和台分類.................................................................12
2.1.2.基本統計學術語.........................................................12
2.1.3.回歸............................................................................14
2.1.4.最小二乘法.................................................................14
2.1.5.判斷擬合好壞.............................................................15
2.1.6.小結............................................................................17
2.2 讀圖 ..........................................................................................17
2.2.1.數值數據的分布.........................................................17
2.2.2.分類數據的分布.........................................................18
2.3 KNIME .....................................................................................21
2.3.1.KNIME簡介..............................................................21
2.3.2.下載和安裝.................................................................21
2.3.3.KNIME基本使用.......................................................21
2.3.4.小結............................................................................28
2.4 課後練習 ..................................................................................28
第3章 線性回歸.........................................................29
3.1 簡單線性回歸 ..........................................................................30
3.1.1.場景說明....................................................................30
3.1.2.KNIME建立工作流...................................................30
3.1.3.數據獲取....................................................................30
3.1.4.觀察數據....................................................................31
3.1.5.數據劃分....................................................................33
3.1.6.模型訓練....................................................................34
3.1.7.模型測試....................................................................37
3.1.8.損失函式....................................................................37
3.2 多元線性回歸初步 ..................................................................38
3.2.1.任務及數據說明.........................................................38
3.2.2.建立基本的工作流.....................................................38
3.2.3.讀取並觀察數據.........................................................39
3.2.4.整合界面....................................................................49
3.3 多元線性回歸進階 ..................................................................51
3.3.1.最佳化模型....................................................................51
3.3.2.正向選擇節點.............................................................55
3.3.3.反向消除....................................................................58
3.3.4.模型解釋....................................................................58
3.3.5.特徵歸一化.................................................................59
3.3.6.使用KNIME具體實現歸一化..................................59
3.3.7.相關係數....................................................................60
3.4 課後練習 ..................................................................................61
第4章 邏輯回歸.........................................................63
4.1 邏輯回歸基本概念 ..................................................................63
4.1.1.分類問題....................................................................63
4.1.2.從線性回歸到邏輯回歸.............................................65
4.1.3.判定邊界....................................................................66
4.1.4.KNIME工作流..........................................................66
4.1.5.讀取數據....................................................................67
4.1.6.數據處理....................................................................67
4.1.7.模型訓練及測試.........................................................68
4.1.8.模型評價....................................................................69
4.2 邏輯回歸實戰 ..........................................................................71
4.2.1.鐵達尼號生存問題背景介紹..................................71
4.2.2.讀取數據....................................................................72
4.2.3.數據處理....................................................................73
4.2.4.數據可視化及刪除無關列.........................................75
4.2.5.模型訓練和測試.........................................................82
4.2.6.模型評價....................................................................83
4.2.7.提交結果....................................................................85
4.2.8.模型解釋....................................................................89
4.3 課後練習 ..................................................................................90
第5章 模型最佳化.........................................................91
5.1 梯度下降 ..................................................................................91
5.1.1.損失函式....................................................................92
5.1.2.使用KNIME最佳化模型..............................................96
5.2 正則化 ......................................................................................98
5.2.1.準確性和健壯性.........................................................98
5.2.2.複雜的模型.................................................................98
5.2.3.欠擬合和過擬合.........................................................98
5.2.4.正則化防止過擬合...................................................100
5.2.5.使用KNIME設定正則化........................................100
5.3 模型評價 ................................................................................101
5.3.1.混淆矩陣..................................................................101
5.3.2.F1..............................................................................103
5.3.3.ROC曲線和AUC...................................................104
5.4 課後練習 ................................................................................106
第6章 支持向量機....................................................107
6.1 支持向量機基本概念 ............................................................107
6.1.1.支持向量機是什麼...................................................107
6.1.2.支持向量是什麼.......................................................108
6.1.3.邏輯回歸與支持向量機的比較................................108
6.1.4.核..............................................................................110
6.1.5.線性核模型調參.......................................................111
6.1.6.非線性核模型調參...................................................113
6.1.7.C與 γ...........................................................................114
6.2 SVM初戰 ..............................................................................114
6.2.1..問題說明..................................................................114
6.2.2.建立工作流...............................................................114
6.2.3.數據觀察..................................................................115
6.2.4.模型訓練與測試.......................................................117
6.2.5.觀察結果..................................................................118
6.3 支持向量機解決鐵達尼號問題 ........................................119
6.3.1.歸一化......................................................................119
6.3.2.核函式......................................................................120
6.3.3.新建工作流...............................................................120
6.3.4.C參數.......................................................................123
6.4 一個重要的問題 ....................................................................124
6.5 課後練習 ................................................................................124
第7章 決策樹...........................................................125
7.1 決策樹簡介 ............................................................................125
7.1.1.決策樹的優點...........................................................125
7.1.2.決策樹的缺點...........................................................126
7.1.3.防止過擬合...............................................................126
7.1.4.問題解析..................................................................126
7.1.5.奧卡姆剃刀...............................................................128
7.1.6.提前結束..................................................................128
7.1.7.剪枝..........................................................................130
7.1.8.組合算法..................................................................131
7.1.9.Adaboosting...............................................................133
7.2 使用決策樹解決鐵達尼號生存問題 ................................135
7.3 決策樹高級套用實戰——特徵工程 ....................................137
7.3.1.數據探尋..................................................................137
7.3.2.特徵工程..................................................................143
7.3.3.異常數據處理...........................................................146
7.4 決策樹高級套用實戰——模型建立與比較 ........................149
7.4.1.決策樹......................................................................149
7.4.2.袋裝..........................................................................153
7.4.3.隨機森林..................................................................157
7.4.4.提升..........................................................................159
7.5 課後練習 ................................................................................160
第8章 深入理解決策樹.............................................161
8.1 決策樹進階 ............................................................................161
8.1.1.如何構建決策樹.......................................................161
8.1.2.ID3算法決定什麼是最好的....................................162
8.1.3.CART算法決定什麼是最好的...............................164
8.1.4.KNIME設定............................................................165
8.2 數據不平衡問題最佳化 ............................................................165
8.2.1.多數數據降採樣.......................................................166
8.2.2.少數數據過採樣.......................................................168
8.2.3.SMOTE算法............................................................170
8.3 課後練習 ................................................................................172
第9章 貝葉斯分析....................................................173
9.1 貝葉斯定理 ............................................................................173
9.1.1.基本術語..................................................................173
9.1.2.條件機率..................................................................174
9.1.3.全機率和貝葉斯.......................................................176
9.1.4.貝葉斯定理...............................................................176
9.1.5.貝葉斯定理在機器學習中的套用............................177
9.2 貝葉斯算法解決銀行客戶分類問題 ....................................178
9.2.1.工作流......................................................................178
9.2.2.貝葉斯算法的學習器節點.......................................178
9.3 情感分析案例 ........................................................................179
9.3.1.安裝外掛程式..................................................................179
9.3.2.建立工作流...............................................................180
9.4 課後練習 ................................................................................183
第10章 深度學習.......................................................185
10.1 深度學習簡介 ......................................................................185
10.1.1.深度學習的關鍵.....................................................186
10.1.2.我們的目標.............................................................186
10.1.3.深度學習圖像識別原理概述..................................187
10.1.4.圖像識別探析.........................................................187
10.2 卷積神經網路(CNN) .....................................................189
10.2.1.CNN基本原理......................................................189
10.2.2.常用CNN模型......................................................193
10.3 KNIME實現卷積神經網路 ................................................195
10.3.1.環境構建.................................................................195
10.3.2.安裝所需的工具.....................................................195
10.3.3.步驟分析.................................................................198
10.4 深度學習開源套用舉例 ......................................................199
10.5 深度學習工商業套用舉例 ..................................................201
10.6 課後練習 ..............................................................................205
參考文獻.......................................................................206,
CONTENT
第1章 人工智慧及機器學習概述...................................1
1.1 人工智慧概述 ............................................................................1
1.1.1.人工智慧簡史...............................................................2
1.1.2.人工智慧是什麼...........................................................4
1.1.3.人工智慧的能力...........................................................5
1.2 機器學習概述 ............................................................................5
1.2.1.機器學習是什麼...........................................................5
1.2.2.以監督學習為例...........................................................6
1.2.3.學習任務......................................................................7
1.2.4.機器學習要解決的基本問題.......................................7
1.2.5.機器學習如何最佳化模型...............................................7
1.2.6.機器學習工作流程.......................................................7
1.2.7.機器學習的各大流派...................................................8
1.2.8.機器學習算法選擇.......................................................8
1.2.9.需要的知識...................................................................9
1.3 深度學習概述 ............................................................................9
1.4 機器學習與統計學 ....................................................................9
1.5 課後練習 ..................................................................................10
第2章 機器學習基礎知識...........................................11
2.1 數學基礎 ..................................................................................11
2.1.1.數據的分類.................................................................12
2.1.2.基本統計學術語.........................................................12
2.1.3.回歸............................................................................14
2.1.4.最小二乘法.................................................................14
2.1.5.判斷擬合好壞.............................................................15
2.1.6.小結............................................................................17
2.2 讀圖 ..........................................................................................17
2.2.1.數值數據的分布.........................................................17
2.2.2.分類數據的分布.........................................................18
2.3 KNIME .....................................................................................21
2.3.1.KNIME簡介..............................................................21
2.3.2.下載和安裝.................................................................21
2.3.3.KNIME基本使用.......................................................21
2.3.4.小結............................................................................28
2.4 課後練習 ..................................................................................28
第3章 線性回歸.........................................................29
3.1 簡單線性回歸 ..........................................................................30
3.1.1.場景說明....................................................................30
3.1.2.KNIME建立工作流...................................................30
3.1.3.數據獲取....................................................................30
3.1.4.觀察數據....................................................................31
3.1.5.數據劃分....................................................................33
3.1.6.模型訓練....................................................................34
3.1.7.模型測試....................................................................37
3.1.8.損失函式....................................................................37
3.2 多元線性回歸初步 ..................................................................38
3.2.1.任務及數據說明.........................................................38
3.2.2.建立基本的工作流.....................................................38
3.2.3.讀取並觀察數據.........................................................39
3.2.4.整合界面....................................................................49
3.3 多元線性回歸進階 ..................................................................51
3.3.1.最佳化模型....................................................................51
3.3.2.正向選擇節點.............................................................55
3.3.3.反向消除....................................................................58
3.3.4.模型解釋....................................................................58
3.3.5.特徵歸一化.................................................................59
3.3.6.使用KNIME具體實現歸一化..................................59
3.3.7.相關係數....................................................................60
3.4 課後練習 ..................................................................................61
第4章 邏輯回歸.........................................................63
4.1 邏輯回歸基本概念 ..................................................................63
4.1.1.分類問題....................................................................63
4.1.2.從線性回歸到邏輯回歸.............................................65
4.1.3.判定邊界....................................................................66
4.1.4.KNIME工作流..........................................................66
4.1.5.讀取數據....................................................................67
4.1.6.數據處理....................................................................67
4.1.7.模型訓練及測試.........................................................68
4.1.8.模型評價....................................................................69
4.2 邏輯回歸實戰 ..........................................................................71
4.2.1.鐵達尼號生存問題背景介紹..................................71
4.2.2.讀取數據....................................................................72
4.2.3.數據處理....................................................................73
4.2.4.數據可視化及刪除無關列.........................................75
4.2.5.模型訓練和測試.........................................................82
4.2.6.模型評價....................................................................83
4.2.7.提交結果....................................................................85
4.2.8.模型解釋....................................................................89
4.3 課後練習 ..................................................................................90
第5章 模型最佳化.........................................................91
5.1 梯度下降 ..................................................................................91
5.1.1.損失函式....................................................................92
5.1.2.使用KNIME最佳化模型..............................................96
5.2 正則化 ......................................................................................98
5.2.1.準確性和健壯性.........................................................98
5.2.2.複雜的模型.................................................................98
5.2.3.欠擬合和過擬合.........................................................98
5.2.4.正則化防止過擬合...................................................100
5.2.5.使用KNIME設定正則化........................................100
5.3 模型評價 ................................................................................101
5.3.1.混淆矩陣..................................................................101
5.3.2.F1..............................................................................103
5.3.3.ROC曲線和AUC...................................................104
5.4 課後練習 ................................................................................106
第6章 支持向量機....................................................107
6.1 支持向量機基本概念 ............................................................107
6.1.1.支持向量機是什麼...................................................107
6.1.2.支持向量是什麼.......................................................108
6.1.3.邏輯回歸與支持向量機的比較................................108
6.1.4.核..............................................................................110
6.1.5.線性核模型調參.......................................................111
6.1.6.非線性核模型調參...................................................113
6.1.7.C與 γ...........................................................................114
6.2 SVM初戰 ..............................................................................114
6.2.1..問題說明..................................................................114
6.2.2.建立工作流...............................................................114
6.2.3.數據觀察..................................................................115
6.2.4.模型訓練與測試.......................................................117
6.2.5.觀察結果..................................................................118
6.3 支持向量機解決鐵達尼號問題 ........................................119
6.3.1.歸一化......................................................................119
6.3.2.核函式......................................................................120
6.3.3.新建工作流...............................................................120
6.3.4.C參數.......................................................................123
6.4 一個重要的問題 ....................................................................124
6.5 課後練習 ................................................................................124
第7章 決策樹...........................................................125
7.1 決策樹簡介 ............................................................................125
7.1.1.決策樹的優點...........................................................125
7.1.2.決策樹的缺點...........................................................126
7.1.3.防止過擬合...............................................................126
7.1.4.問題解析..................................................................126
7.1.5.奧卡姆剃刀...............................................................128
7.1.6.提前結束..................................................................128
7.1.7.剪枝..........................................................................130
7.1.8.組合算法..................................................................131
7.1.9.Adaboosting...............................................................133
7.2 使用決策樹解決鐵達尼號生存問題 ................................135
7.3 決策樹高級套用實戰——特徵工程 ....................................137
7.3.1.數據探尋..................................................................137
7.3.2.特徵工程..................................................................143
7.3.3.異常數據處理...........................................................146
7.4 決策樹高級套用實戰——模型建立與比較 ........................149
7.4.1.決策樹......................................................................149
7.4.2.袋裝..........................................................................153
7.4.3.隨機森林..................................................................157
7.4.4.提升..........................................................................159
7.5 課後練習 ................................................................................160
第8章 深入理解決策樹.............................................161
8.1 決策樹進階 ............................................................................161
8.1.1.如何構建決策樹.......................................................161
8.1.2.ID3算法決定什麼是最好的....................................162
8.1.3.CART算法決定什麼是最好的...............................164
8.1.4.KNIME設定............................................................165
8.2 數據不平衡問題最佳化 ............................................................165
8.2.1.多數數據降採樣.......................................................166
8.2.2.少數數據過採樣.......................................................168
8.2.3.SMOTE算法............................................................170
8.3 課後練習 ................................................................................172
第9章 貝葉斯分析....................................................173
9.1 貝葉斯定理 ............................................................................173
9.1.1.基本術語..................................................................173
9.1.2.條件機率..................................................................174
9.1.3.全機率和貝葉斯.......................................................176
9.1.4.貝葉斯定理...............................................................176
9.1.5.貝葉斯定理在機器學習中的套用............................177
9.2 貝葉斯算法解決銀行客戶分類問題 ....................................178
9.2.1.工作流......................................................................178
9.2.2.貝葉斯算法的學習器節點.......................................178
9.3 情感分析案例 ........................................................................179
9.3.1.安裝外掛程式..................................................................179
9.3.2.建立工作流...............................................................180
9.4 課後練習 ................................................................................183
第10章 深度學習.......................................................185
10.1 深度學習簡介 ......................................................................185
10.1.1.深度學習的關鍵.....................................................186
10.1.2.我們的目標.............................................................186
10.1.3.深度學習圖像識別原理概述..................................187
10.1.4.圖像識別探析.........................................................187
10.2 卷積神經網路(CNN) .....................................................189
10.2.1.CNN基本原理......................................................189
10.2.2.常用CNN模型......................................................193
10.3 KNIME實現卷積神經網路 ................................................195
10.3.1.環境構建.................................................................195
10.3.2.安裝所需的工具.....................................................195
10.3.3.步驟分析.................................................................198
10.4 深度學習開源套用舉例 ......................................................199
10.5 深度學習工商業套用舉例 ..................................................201
10.6 課後練習 ..............................................................................205
參考文獻.......................................................................206
1.2.8.機器學習算法選擇.......................................................8
1.2.9.需要的知識...................................................................9
1.3 深度學習概述 ............................................................................9
1.4 機器學習與統計學 ....................................................................9
1.5 課後練習 ..................................................................................10
第2章 機器學習基礎知識...........................................11
2.1 數學基礎 ..................................................................................11
2.1.1.數據的分類.................................................................12
2.1.2.基本統計學術語.........................................................12
2.1.3.回歸............................................................................14
2.1.4.最小二乘法.................................................................14
2.1.5.判斷擬合好壞.............................................................15
2.1.6.小結............................................................................17
2.2 讀圖 ..........................................................................................17
2.2.1.數值數據的分布.........................................................17
2.2.2.分類數據的分布.........................................................18
2.3 KNIME .....................................................................................21
2.3.1.KNIME簡介..............................................................21
2.3.2.下載和安裝.................................................................21
2.3.3.KNIME基本使用.......................................................21
2.3.4.小結............................................................................28
2.4 課後練習 ..................................................................................28
第3章 線性回歸.........................................................29
3.1 簡單線性回歸 ..........................................................................30
3.1.1.場景說明....................................................................30
3.1.2.KNIME建立工作流...................................................30
3.1.3.數據獲取....................................................................30
3.1.4.觀察數據....................................................................31
3.1.5.數據劃分....................................................................33
3.1.6.模型訓練....................................................................34
3.1.7.模型測試....................................................................37
3.1.8.損失函式....................................................................37
3.2 多元線性回歸初步 ..................................................................38
3.2.1.任務及數據說明.........................................................38
3.2.2.建立基本的工作流.....................................................38
3.2.3.讀取並觀察數據.........................................................39
3.2.4.整合界面....................................................................49
3.3 多元線性回歸進階 ..................................................................51
3.3.1.最佳化模型....................................................................51
3.3.2.正向選擇節點.............................................................55
3.3.3.反向消除....................................................................58
3.3.4.模型解釋....................................................................58
3.3.5.特徵歸一化.................................................................59
3.3.6.使用KNIME具體實現歸一化..................................59
3.3.7.相關係數....................................................................60
3.4 課後練習 ..................................................................................61
第4章 邏輯回歸.........................................................63
4.1 邏輯回歸基本概念 ..................................................................63
4.1.1.分類問題....................................................................63
4.1.2.從線性回歸到邏輯回歸.............................................65
4.1.3.判定邊界....................................................................66
4.1.4.KNIME工作流..........................................................66
4.1.5.讀取數據....................................................................67
4.1.6.數據處理....................................................................67
4.1.7.模型訓練及測試.........................................................68
4.1.8.模型評價....................................................................69
4.2 邏輯回歸實戰 ..........................................................................71
4.2.1.鐵達尼號生存問題背景介紹..................................71
4.2.2.讀取數據....................................................................72
4.2.3.數據處理....................................................................73
4.2.4.數據可視化及刪除無關列.........................................75
4.2.5.模型訓練和測試.........................................................82
4.2.6.模型評價....................................................................83
4.2.7.提交結果....................................................................85
4.2.8.模型解釋....................................................................89
4.3 課後練習 ..................................................................................90
第5章 模型最佳化.........................................................91
5.1 梯度下降 ..................................................................................91
5.1.1.損失函式....................................................................92
5.1.2.使用KNIME最佳化模型..............................................96
5.2 正則化 ......................................................................................98
5.2.1.準確性和健壯性.........................................................98
5.2.2.複雜的模型.................................................................98
5.2.3.欠擬合和過擬合.........................................................98
5.2.4.正則化防止過擬合...................................................100
5.2.5.使用KNIME設定正則化........................................100
5.3 模型評價 ................................................................................101
5.3.1.混淆矩陣..................................................................101
5.3.2.F1..............................................................................103
5.3.3.ROC曲線和AUC...................................................104
5.4 課後練習 ................................................................................106
第6章 支持向量機....................................................107
6.1 支持向量機基本概念 ............................................................107
6.1.1.支持向量機是什麼...................................................107
6.1.2.支持向量是什麼.......................................................108
6.1.3.邏輯回歸與支持向量機的比較................................108
6.1.4.核..............................................................................110
6.1.5.線性核模型調參.......................................................111
6.1.6.非線性核模型調參...................................................113
6.1.7.C與 γ...........................................................................114
6.2 SVM初戰 ..............................................................................114
6.2.1..問題說明..................................................................114
6.2.2.建立工作流...............................................................114
6.2.3.數據觀察..................................................................115
6.2.4.模型訓練與測試.......................................................117
6.2.5.觀察結果..................................................................118
6.3 支持向量機解決鐵達尼號問題 ........................................119
6.3.1.歸一化......................................................................119
6.3.2.核函式......................................................................120
6.3.3.新建工作流...............................................................120
6.3.4.C參數.......................................................................123
6.4 一個重要的問題 ....................................................................124
6.5 課後練習 ................................................................................124
第7章 決策樹...........................................................125
7.1 決策樹簡介 ............................................................................125
7.1.1.決策樹的優點...........................................................125
7.1.2.決策樹的缺點...........................................................126
7.1.3.防止過擬合...............................................................126
7.1.4.問題解析..................................................................126
7.1.5.奧卡姆剃刀...............................................................128
7.1.6.提前結束..................................................................128
7.1.7.剪枝..........................................................................130
7.1.8.組合算法..................................................................131
7.1.9.Adaboosting...............................................................133
7.2 使用決策樹解決鐵達尼號生存問題 ................................135
7.3 決策樹高級套用實戰——特徵工程 ....................................137
7.3.1.數據探尋..................................................................137
7.3.2.特徵工程..................................................................143
7.3.3.異常數據處理...........................................................146
7.4 決策樹高級套用實戰——模型建立與比較 ........................149
7.4.1.決策樹......................................................................149
7.4.2.袋裝..........................................................................153
7.4.3.隨機森林..................................................................157
7.4.4.提升..........................................................................159
7.5 課後練習 ................................................................................160
第8章 深入理解決策樹.............................................161
8.1 決策樹進階 ............................................................................161
8.1.1.如何構建決策樹.......................................................161
8.1.2.ID3算法決定什麼是最好的....................................162
8.1.3.CART算法決定什麼是最好的...............................164
8.1.4.KNIME設定............................................................165
8.2 數據不平衡問題最佳化 ............................................................165
8.2.1.多數數據降採樣.......................................................166
8.2.2.少數數據過採樣.......................................................168
8.2.3.SMOTE算法............................................................170
8.3 課後練習 ................................................................................172
第9章 貝葉斯分析....................................................173
9.1 貝葉斯定理 ............................................................................173
9.1.1.基本術語..................................................................173
9.1.2.條件機率..................................................................174
9.1.3.全機率和貝葉斯.......................................................176
9.1.4.貝葉斯定理...............................................................176
9.1.5.貝葉斯定理在機器學習中的套用............................177
9.2 貝葉斯算法解決銀行客戶分類問題 ....................................178
9.2.1.工作流......................................................................178
9.2.2.貝葉斯算法的學習器節點.......................................178
9.3 情感分析案例 ........................................................................179
9.3.1.安裝外掛程式..................................................................179
9.3.2.建立工作流...............................................................180
9.4 課後練習 ................................................................................183
第10章 深度學習.......................................................185
10.1 深度學習簡介 ......................................................................185
10.1.1.深度學習的關鍵.....................................................186
10.1.2.我們的目標.............................................................186
10.1.3.深度學習圖像識別原理概述..................................187
10.1.4.圖像識別探析.........................................................187
10.2 卷積神經網路(CNN) .....................................................189
10.2.1.CNN基本原理......................................................189
10.2.2.常用CNN模型......................................................193
10.3 KNIME實現卷積神經網路 ................................................195
10.3.1.環境構建.................................................................195
10.3.2.安裝所需的工具.....................................................195
10.3.3.步驟分析.................................................................198
10.4 深度學習開源套用舉例 ......................................................199
10.5 深度學習工商業套用舉例 ..................................................201
10.6 課後練習 ..............................................................................205
參考文獻.......................................................................206,
CONTENT
第1章 人工智慧及機器學習概述...................................1
1.1 人工智慧概述 ............................................................................1
1.1.1.人工智慧簡史...............................................................2
1.1.2.人工智慧是什麼...........................................................4
1.1.3.人工智慧的能力...........................................................5
1.2 機器學習概述 ............................................................................5
1.2.1.機器學習是什麼...........................................................5
1.2.2.以監督學習為例...........................................................6
1.2.3.學習任務......................................................................7
1.2.4.機器學習要解決的基本問題.......................................7
1.2.5.機器學習如何最佳化模型...............................................7
1.2.6.機器學習工作流程.......................................................7
1.2.7.機器學習的各大流派...................................................8
1.2.8.機器學習算法選擇.......................................................8
1.2.9.需要的知識...................................................................9
1.3 深度學習概述 ............................................................................9
1.4 機器學習與統計學 ....................................................................9
1.5 課後練習 ..................................................................................10
第2章 機器學習基礎知識...........................................11
2.1 數學基礎 ..................................................................................11
2.1.1.數據的分類.................................................................12
2.1.2.基本統計學術語.........................................................12
2.1.3.回歸............................................................................14
2.1.4.最小二乘法.................................................................14
2.1.5.判斷擬合好壞.............................................................15
2.1.6.小結............................................................................17
2.2 讀圖 ..........................................................................................17
2.2.1.數值數據的分布.........................................................17
2.2.2.分類數據的分布.........................................................18
2.3 KNIME .....................................................................................21
2.3.1.KNIME簡介..............................................................21
2.3.2.下載和安裝.................................................................21
2.3.3.KNIME基本使用.......................................................21
2.3.4.小結............................................................................28
2.4 課後練習 ..................................................................................28
第3章 線性回歸.........................................................29
3.1 簡單線性回歸 ..........................................................................30
3.1.1.場景說明....................................................................30
3.1.2.KNIME建立工作流...................................................30
3.1.3.數據獲取....................................................................30
3.1.4.觀察數據....................................................................31
3.1.5.數據劃分....................................................................33
3.1.6.模型訓練....................................................................34
3.1.7.模型測試....................................................................37
3.1.8.損失函式....................................................................37
3.2 多元線性回歸初步 ..................................................................38
3.2.1.任務及數據說明.........................................................38
3.2.2.建立基本的工作流.....................................................38
3.2.3.讀取並觀察數據.........................................................39
3.2.4.整合界面....................................................................49
3.3 多元線性回歸進階 ..................................................................51
3.3.1.最佳化模型....................................................................51
3.3.2.正向選擇節點.............................................................55
3.3.3.反向消除....................................................................58
3.3.4.模型解釋....................................................................58
3.3.5.特徵歸一化.................................................................59
3.3.6.使用KNIME具體實現歸一化..................................59
3.3.7.相關係數....................................................................60
3.4 課後練習 ..................................................................................61
第4章 邏輯回歸.........................................................63
4.1 邏輯回歸基本概念 ..................................................................63
4.1.1.分類問題....................................................................63
4.1.2.從線性回歸到邏輯回歸.............................................65
4.1.3.判定邊界....................................................................66
4.1.4.KNIME工作流..........................................................66
4.1.5.讀取數據....................................................................67
4.1.6.數據處理....................................................................67
4.1.7.模型訓練及測試.........................................................68
4.1.8.模型評價....................................................................69
4.2 邏輯回歸實戰 ..........................................................................71
4.2.1.鐵達尼號生存問題背景介紹..................................71
4.2.2.讀取數據....................................................................72
4.2.3.數據處理....................................................................73
4.2.4.數據可視化及刪除無關列.........................................75
4.2.5.模型訓練和測試.........................................................82
4.2.6.模型評價....................................................................83
4.2.7.提交結果....................................................................85
4.2.8.模型解釋....................................................................89
4.3 課後練習 ..................................................................................90
第5章 模型最佳化.........................................................91
5.1 梯度下降 ..................................................................................91
5.1.1.損失函式....................................................................92
5.1.2.使用KNIME最佳化模型..............................................96
5.2 正則化 ......................................................................................98
5.2.1.準確性和健壯性.........................................................98
5.2.2.複雜的模型.................................................................98
5.2.3.欠擬合和過擬合.........................................................98
5.2.4.正則化防止過擬合...................................................100
5.2.5.使用KNIME設定正則化........................................100
5.3 模型評價 ................................................................................101
5.3.1.混淆矩陣..................................................................101
5.3.2.F1..............................................................................103
5.3.3.ROC曲線和AUC...................................................104
5.4 課後練習 ................................................................................106
第6章 支持向量機....................................................107
6.1 支持向量機基本概念 ............................................................107
6.1.1.支持向量機是什麼...................................................107
6.1.2.支持向量是什麼.......................................................108
6.1.3.邏輯回歸與支持向量機的比較................................108
6.1.4.核..............................................................................110
6.1.5.線性核模型調參.......................................................111
6.1.6.非線性核模型調參...................................................113
6.1.7.C與 γ...........................................................................114
6.2 SVM初戰 ..............................................................................114
6.2.1..問題說明..................................................................114
6.2.2.建立工作流...............................................................114
6.2.3.數據觀察..................................................................115
6.2.4.模型訓練與測試.......................................................117
6.2.5.觀察結果..................................................................118
6.3 支持向量機解決鐵達尼號問題 ........................................119
6.3.1.歸一化......................................................................119
6.3.2.核函式......................................................................120
6.3.3.新建工作流...............................................................120
6.3.4.C參數.......................................................................123
6.4 一個重要的問題 ....................................................................124
6.5 課後練習 ................................................................................124
第7章 決策樹...........................................................125
7.1 決策樹簡介 ............................................................................125
7.1.1.決策樹的優點...........................................................125
7.1.2.決策樹的缺點...........................................................126
7.1.3.防止過擬合...............................................................126
7.1.4.問題解析..................................................................126
7.1.5.奧卡姆剃刀...............................................................128
7.1.6.提前結束..................................................................128
7.1.7.剪枝..........................................................................130
7.1.8.組合算法..................................................................131
7.1.9.Adaboosting...............................................................133
7.2 使用決策樹解決鐵達尼號生存問題 ................................135
7.3 決策樹高級套用實戰——特徵工程 ....................................137
7.3.1.數據探尋..................................................................137
7.3.2.特徵工程..................................................................143
7.3.3.異常數據處理...........................................................146
7.4 決策樹高級套用實戰——模型建立與比較 ........................149
7.4.1.決策樹......................................................................149
7.4.2.袋裝..........................................................................153
7.4.3.隨機森林..................................................................157
7.4.4.提升..........................................................................159
7.5 課後練習 ................................................................................160
第8章 深入理解決策樹.............................................161
8.1 決策樹進階 ............................................................................161
8.1.1.如何構建決策樹.......................................................161
8.1.2.ID3算法決定什麼是最好的....................................162
8.1.3.CART算法決定什麼是最好的...............................164
8.1.4.KNIME設定............................................................165
8.2 數據不平衡問題最佳化 ............................................................165
8.2.1.多數數據降採樣.......................................................166
8.2.2.少數數據過採樣.......................................................168
8.2.3.SMOTE算法............................................................170
8.3 課後練習 ................................................................................172
第9章 貝葉斯分析....................................................173
9.1 貝葉斯定理 ............................................................................173
9.1.1.基本術語..................................................................173
9.1.2.條件機率..................................................................174
9.1.3.全機率和貝葉斯.......................................................176
9.1.4.貝葉斯定理...............................................................176
9.1.5.貝葉斯定理在機器學習中的套用............................177
9.2 貝葉斯算法解決銀行客戶分類問題 ....................................178
9.2.1.工作流......................................................................178
9.2.2.貝葉斯算法的學習器節點.......................................178
9.3 情感分析案例 ........................................................................179
9.3.1.安裝外掛程式..................................................................179
9.3.2.建立工作流...............................................................180
9.4 課後練習 ................................................................................183
第10章 深度學習.......................................................185
10.1 深度學習簡介 ......................................................................185
10.1.1.深度學習的關鍵.....................................................186
10.1.2.我們的目標.............................................................186
10.1.3.深度學習圖像識別原理概述..................................187
10.1.4.圖像識別探析.........................................................187
10.2 卷積神經網路(CNN) .....................................................189
10.2.1.CNN基本原理......................................................189
10.2.2.常用CNN模型......................................................193
10.3 KNIME實現卷積神經網路 ................................................195
10.3.1.環境構建.................................................................195
10.3.2.安裝所需的工具.....................................................195
10.3.3.步驟分析.................................................................198
10.4 深度學習開源套用舉例 ......................................................199
10.5 深度學習工商業套用舉例 ..................................................201
10.6 課後練習 ..............................................................................205
參考文獻.......................................................................206

相關詞條

熱門詞條

聯絡我們