《AI制勝:機器學習極簡入門》是2020年清華大學出版社出版的圖書,作者是宋立桓。
基本介紹
- 中文名:AI制勝:機器學習極簡入門
- 作者:宋立桓
- 出版社:清華大學出版社
- ISBN:9787302555513
內容簡介,圖書目錄,
內容簡介
為了避免機器學習背後的複雜數學原理以及異常複雜的算法證明和推導嚇退一大批初學者,本書遵循“極簡入門”的理念,通過通俗易懂的語言,豐富的圖示和經典的案例,有效地降低了學習的門檻,讓廣大機器學習愛好者輕鬆入門機器學習。
本書共分11章,覆蓋的主要內容有機器學習概述、數據預處理、K最近鄰算法、回歸算法、決策樹、K-means聚類算法、隨機森林、樸素貝葉斯算法、支持向量機SVM、神經網路(卷積神經網路、Keras深度學習框架)和人臉識別入門等。從最簡單的常識來切入AI領域,打造無縫平滑的學習體驗。
本書的讀者不需要具有高等數學的深厚知識,也不需要有機器學習或者人工智慧(AI)的基礎,只需具備Python語言的基礎知識和簡單了解過NumPy、Pandas等科學基礎庫,就可以輕鬆閱讀並掌握。另外,高等院校和培訓機構也可以將此書作為機器學習入門教材使用。
圖書目錄
目 錄
第1章 機器學習概述 1
1.1 什麼是機器學習 1
1.2 機器學習的流程 3
1.2.1 數據收集 3
1.2.2 數據預處理 3
1.2.3 特徵工程 4
1.2.4 模型構建和訓練 4
1.3 機器學習該如何學 5
1.3.1 AI時代首選Python 5
1.3.2 PyCharm可視化編輯器和Anaconda大禮包 7
1.3.3 掌握算法原理與掌握機器學習軟體庫同等重要 13
1.3.4 機器學習與深度學習的區別 13
1.4 機器學習分類 15
1.4.1 監督學習 15
1.4.2 無監督學習 16
1.4.3 強化學習 16
1.5 過擬合和欠擬合 17
1.5.1 過擬合 18
1.5.2 欠擬合 18
1.6 衡量機器學習模型的指標 19
1.6.1 正確率、精確率和召回率 19
1.6.2 F1 score和ROC曲線 21
第2章 機器學習中的數據預處理 24
2.1 數據預處理的重要性和原則 24
2.2 數據預處理方法介紹 25
2.2.1 數據預處理案例——標準化、歸一化、二值化 25
2.2.2 數據預處理案例——缺失值補全、標籤化 26
2.2.3 數據預處理案例——獨熱編碼 28
2.2.4 通過數據預處理提高模型準確率 29
2.3 數據降維 31
2.3.1 什麼叫數據降維 31
2.3.2 PCA主成分分析原理 31
2.3.3 PCA主成分分析實戰案例 33
第3章 k最近鄰算法 36
3.1 K最近鄰算法的原理 36
3.2 K最近鄰算法過程詳解 37
3.3 KNN算法的注意事項 39
3.3.1 k近鄰的k值該如何選取 39
3.3.2 距離的度量 39
3.3.3 特徵歸一化的必要性 41
3.4 K最近鄰算法案例分享 42
3.4.1 電影分類kNN算法實戰 42
3.4.2 使用scikit-learn機器學習庫內置的kNN算法實現水果識別器 44
3.5 KNN算法優缺點 47
第4章 回歸算法 49
4.1 線性回歸 49
4.1.1 什麼是線性回歸 49
4.1.2 最小二乘法 51
4.1.3 梯度下降法 52
4.2 線性回歸案例實戰 57
4.2.1 房價預測線性回歸模型案例一 57
4.2.2 房價預測線性回歸模型案例二 60
4.3 邏輯回歸 62
4.3.1 邏輯回歸概念和原理 62
4.3.2 邏輯回歸案例實戰 64
4.4 回歸算法總結和優缺點 65
第5章 決策樹 66
5.1 決策樹概念 66
5.2 信息熵 68
5.3 信息增益與信息增益比 69
5.4 基尼係數 70
5.5 過擬合與剪枝 70
5.6 決策樹算法案例實戰——預測患者佩戴隱形眼鏡類型 71
5.7 決策樹算法實戰案例——電影喜好預測 73
5.8 總結 77
第6章 K-means聚類算法 78
6.1 何為聚類 78
6.2 K-MEANS算法思想和原理 79
6.3 K-MEANS算法涉及的參數和優缺點 82
6.3.1 K-means涉及參數 82
6.3.2 K-means優缺點 84
6.4 K-MEANS套用場景 84
6.5 K-MEANS聚類算法實現鳶尾花數據的聚類 85
6.6 K-MEANS算法實現客戶價值分析 87
6.7 K-MEANS算法實現對亞洲足球隊做聚類 90
第7章 隨機森林 92
7.1 隨機森林概述 92
7.1.1 什麼是隨機森林 92
7.1.2 隨機森林的優缺點 93
7.2 隨機森林實戰——紅酒數據集案例 94
7.3 隨機森林算法實戰——鐵達尼號生存預測 97
第8章 樸素貝葉斯算法 101
8.1 樸素貝葉斯算法概念和原理 101
8.2 貝葉斯算法實戰案例——曲奇餅 105
8.3 貝葉斯算法案例實戰——單詞拼寫糾錯 106
8.4 貝葉斯算法案例實戰——識別中文垃圾郵件 109
8.5 貝葉斯算法案例實戰——鳶尾花分類預測 112
第9章 支持向量機SVM 116
9.1 支持向量機概述 116
9.2 工作原理 119
9.2.1 線性分類 119
9.2.2 線性不可分 120
9.2.3 核函式 122
9.3 SVM的核函式選擇和參數的調整 122
9.4 SVM算法案例實戰——波士頓房價分析 124
9.5 SVM算法案例實戰——鳶尾花分類 126
9.6 SVM算法優缺點 128
第10章 神經網路 130
10.1 神經網路概念 130
10.1.1 神經元 130
10.1.2 激活函式 132
10.1.3 神經網路 133
10.2 卷積神經網路(CNN) 135
10.2.1 計算機識別圖像的過程 135
10.2.2 卷積神經網路詳解 136
10.3 用PYTHON實現自己的神經網路案例 138
10.4 多層神經網路基於SKLEARN的實現案例 141
10.5 使用KERAS框架實現神經網路案例 145
10.5.1 Keras深度學習框架簡介和安裝 145
10.5.2 Keras實現多層感知器模型MLP 146
10.5.3 Keras實現卷積神經網路CNN 149
第11章 人臉識別入門實踐 151
11.1 人臉識別簡介 151
11.1.1 什麼是人臉識別 151
11.1.2 人臉識別過程步驟 153
11.2 人臉檢測和關鍵點定位實戰 156
11.3 人臉表情分析——情緒識別實戰 160
11.4 我能認識你——人臉識別實戰 161