Python機器學習經典實例

Python機器學習經典實例

《Python機器學習經典實例》是2019年9月人民郵電出版社出版的圖書,作者是[美]普拉提克·喬西(Prateek Joshi)。

基本介紹

  • 書名:Python機器學習經典實例
  • 作者:[美]普拉提克·喬西(Prateek Joshi)
  • ISBN:9787115465276
  • 頁數:244頁
  • 定價:59元
  • 出版社:人民郵電出版社
  • 出版時間:2019年9月
  • 裝幀:平裝
  • 開本:16開
內容簡介,圖書目錄,

內容簡介

在如今這個處處以數據驅動的世界中,機器學習正變得越來越大眾化。它已經被廣泛地套用於不同領域,如搜尋引擎、機習記說漿器人、無人駕駛汽車等。本書首先通過實用的案例介紹機器學習的基礎知識,然後介紹一些稍充雄采微複雜的機器學習算法,例如支持向量機、極-端隨機森林、隱馬爾可夫模型、條件隨機場、深度神經網路,等等。
本書是為想用機器學習算法開發應用程式的Python 程式設計師準備的。它適合Python 初學者閱讀,不過熟悉Python 編程方法對體驗示例代碼店重大有裨益。

圖書目錄

第 1 章 監督學榜堡察習 ............................................. 1
1.1 簡介 ................................................. 1
1.2 數據預處理技術 ....................................... 2
1.2.1 準備工作 ....................................... 2
1.2.2 詳細步驟 ....................................... 2
1.3 標記編碼方法 ........................................... 4
1.4 創建線性回歸器 ....................................... 6
1.4.1 準備工笑棵鴉作 ....................................... 6
1.4.2 詳細步驟 ....................................... 7
1.5 計算慨應紙回歸準確性 ....................................... 9
1.5.1 準備工作 ....................................... 9
1.5.2 詳細步驟 ...................................... 10
1.6 保存模型數據 .......................................... 10
1.7 創建嶺回歸器 .......................................... 11
1.7.1 準備工作 ...................................... 11
1.7.2 詳細步驟 ...................................... 12
1.8 創建多項式回歸器 .................................. 13
1.8.1 準備工作 ...................................... 13
1.8.2 詳細步驟 ...................................... 14
1.9 估算房屋價格 .......................................... 15
1.9.1 準備工作 ...................................... 15
1.9.2 詳細抹汽棄洪步驟 ...................................... 16
1.10 計算特徵的相對重要性 ......................... 17
1.11 評估共享腳踏車的需求分布 ..................... 19
1.11.1 準備工作 .................................. 19
1.11.2 詳細步驟 .................................. 19
1.11.3 更多內容 .................................. 21
第 2 章 創建分類器 ........................................ 24
2.1 簡介 ........................................... 24
2.2 建立簡單分類器 ...................................... 25
2.2.1 詳細步驟 ...................................... 25
2.2.2 更多內容 ...................................... 27
2.3 建立邏輯回歸分類器 .............................. 27
2.4 建立樸素貝葉斯分類器 ........................... 31
2.5 將數據集分割成訓練集和測試集 ........... 32
2.6 用交叉驗證檢驗模型準確性 ................... 33
2.6.1 準備工作 ...................................... 34
2.6.2 詳細步驟 ...................................... 34
2.7 混淆矩陣可視化 ...................................... 35
2.8 提取性能報告 .......................................... 37
2.9 根據汽車特徵評估質量 ........................... 38
2.9.1 準備工作 ...................................... 38
2.9.2 詳細步驟 ...................................... 38
2.10 生成驗證曲線 ........................................ 40
2.11 生成學習曲線 ........................................ 43
2.12 估算收入階 層 ........................................ 45
第3 章 預測建模 ............................................ 48
3.1 簡介 ............................................ 48
3.2 用SVM 建立線性分類器 ........................ 49
3.2.1 準備工作 ...................................... 49
3.2.2 詳細步驟 ...................................... 50
3.3 用SVM 建立非線性分類器 .................... 53
3.4 解決類型數量不平衡問題 ....................... 55
3.5 提取置信度 .............................................. 58
3.6 尋找最優超參數 ...................................... 60
3.7 建立事件預測器 ...................................... 62
3.7.1 準備工作 ...................................... 62
3.7.2 詳細步驟 ...................................... 62
3.8 估算交通流量 .......................................... 64
3.8.1 準備工作 ...................................... 64
3.8.2 詳細步驟 ...................................... 64
第4 章 無監督學習——聚類....................... 67
4.1 簡介 ....................................... 67
4.2 用k-means 算法聚類數據 ....................... 67
4.3 用矢量量化壓縮圖片 .............................. 70
4.4 建立均值漂移聚類模型 ........................... 74
4.5 用凝聚層次聚類進行數據分組 ............... 76
4.6 評價聚類算法的聚類效果 ....................... 79
4.7 用DBSCAN 算法自動估算集群數量 ..... 82
4.8 探索股票數據的模式 .............................. 86
4.9 建立客戶細分模型 .................................. 88
第5 章 構建推薦引擎 ................................... 91
5.1 簡介 ...................................... 91
5.2 為數據處理構建函式組合 ....................... 92
5.3 構建機器學習流水線 .............................. 93
5.3.1 詳細步驟 ...................................... 93
5.3.2 工作原理 ...................................... 95
5.4 尋找最近鄰 .............................................. 95
5.5 構建一個KNN 分類器 ............................ 98
5.5.1 詳細步驟 ...................................... 98
5.5.2 工作原理 .................................... 102
5.6 構建一個KNN 回歸器 .......................... 102
5.6.1 詳細步驟 .................................... 102
5.6.2 工作原理 .................................... 104
5.7 計算歐氏距離分數 ................................ 105
5.8 計算皮爾遜相關係數 ............................ 106
5.9 尋找數據集中的相似用戶 ..................... 108
5.10 生成電影推薦 ...................................... 109
第6 章 分析文本數據 ................................. 112
6.1 簡介 ....................................... 112
6.2 用標記解析的方法預處理數據 ............. 113
6.3 提取文本數據的詞幹 ............................ 114
6.3.1 詳細步驟 .................................... 114
6.3.2 工作原理 .................................... 115
6.4 用詞形還原的方法還原文本的基本形式 .................... 116
6.5 用分塊的方法劃分文本 ........................ 117
6.6 創建詞袋模型 ........................................ 118
6.6.1 詳細步驟 .................................... 118
6.6.2 工作原理 .................................... 120
6.7 創建文本分類器 .................................... 121
6.7.1 詳細步驟 .................................... 121
6.7.2 工作原理 .................................... 123
6.8 識別性別 ............................................. 124
6.9 分析句子的情感 .................................... 125
6.9.1 詳細步驟 .................................... 126
6.9.2 工作原理 .................................... 128
6.10 用主題建模識別文本的模式 ............... 128
6.10.1 詳細步驟 .................................. 128
6.10.2 工作原理 .................................. 131
第7 章 語音識別 ......................................... 132
7.1 簡介 .......................................... 132
7.2 讀取和繪製音頻數據 ............................ 132
7.3 將音頻信號轉換為頻域 ........................ 134
7.4 自定義參數生成音頻信號 ..................... 136
7.5 合成音樂 .......................................... 138
7.6 提取頻域特徵 ........................................ 140
7.7 創建隱馬爾科夫模型 ............................ 142
7.8 創建一個語音識別器 ............................ 143
第8 章 解剖時間序列和時序數據 ............ 147
8.1 簡介 ............................................. 147
8.2 將數據轉換為時間序列格式 ................. 148
8.3 切分時間序列數據 ................................ 150
8.4 操作時間序列數據 ................................ 152
8.5 從時間序列數據中提取統計數字 ......... 154
8.6 針對序列數據創建隱馬爾科夫模型 ..... 157
8.6.1 準備工作 .................................... 158
8.6.2 詳細步驟 .................................... 158
8.7 針對序列文本數據創建條件隨機場 ..... 161
8.7.1 準備工作 .................................... 161
8.7.2 詳細步驟 .................................... 161
8.8 用隱馬爾科夫模型分析股票市場數據.......................... 164
第9 章 圖像內容分析 ................................. 166
9.1 簡介 .............................................. 166
9.2 用OpenCV-Pyhon 操作圖像 ................. 167
9.3 檢測邊 ........................................ 170
9.4 直方圖均衡化 ........................................ 174
9.5 檢測稜角 .................................. 176
9.6 檢測SIFT 特徵點 .................................. 178
9.7 創建Star 特徵檢測器 ............................ 180
9.8 利用視覺碼本和向量量化創建特徵 ...... 182
9.9 用極 端隨機森林訓練圖像分類器 .......... 185
9.10 創建一個對象識別器 ........................... 187
第 10 章 人臉識別 ........................................ 189
10.1 簡介 ........................................... 189
10.2 從網路攝像頭採集和處理視頻信息 .... 189
10.3 用Haar 級聯創建一個人臉識別器 ...... 191
10.4 創建一個眼睛和鼻子檢測器 ............... 193
10.5 做主成分分析 ...................................... 196
10.6 做核主成分分析 .................................. 197
10.7 做盲源分離 .......................................... 201
10.8 用局部二值模式直方圖創建一個人臉識別器 ................ 205
第 11 章 深度神經網路 ............................... 210
11.1 簡介 ........................................ 210
11.2 創建一個感知器 .................................. 211
11.3 創建一個單層神經網路 ....................... 213
11.4 創建一個深度神經網路 ....................... 216
11.5 創建一個向量量化器........................... 219
11.6 為序列數據分析創建一個遞歸神經網路 ...................... 221
11.7 在光學字元識別資料庫中將字元可視化 ...................... 225
11.8 用神經網路創建一個光學字元識別器 ....................... 226
第 12 章 可視化數據 ................................... 230
12.1 簡介 ............................................... 230
12.2 畫3D 散點圖 ....................................... 230
12.3 畫氣泡圖 ............................................ 232
12.4 畫動態氣泡圖 ...................................... 233
12.5 畫餅圖 ............................................... 235
12.6 畫日期格式的時間序列數據 ............... 237
12.7 畫直方圖 ............................................ 239
12.8 可視化熱力圖 ...................................... 241
12.9 動態信號的可視化模擬 ....................... 242
1.9 估算房屋價格 .......................................... 15
1.9.1 準備工作 ...................................... 15
1.9.2 詳細步驟 ...................................... 16
1.10 計算特徵的相對重要性 ......................... 17
1.11 評估共享腳踏車的需求分布 ..................... 19
1.11.1 準備工作 .................................. 19
1.11.2 詳細步驟 .................................. 19
1.11.3 更多內容 .................................. 21
第 2 章 創建分類器 ........................................ 24
2.1 簡介 ........................................... 24
2.2 建立簡單分類器 ...................................... 25
2.2.1 詳細步驟 ...................................... 25
2.2.2 更多內容 ...................................... 27
2.3 建立邏輯回歸分類器 .............................. 27
2.4 建立樸素貝葉斯分類器 ........................... 31
2.5 將數據集分割成訓練集和測試集 ........... 32
2.6 用交叉驗證檢驗模型準確性 ................... 33
2.6.1 準備工作 ...................................... 34
2.6.2 詳細步驟 ...................................... 34
2.7 混淆矩陣可視化 ...................................... 35
2.8 提取性能報告 .......................................... 37
2.9 根據汽車特徵評估質量 ........................... 38
2.9.1 準備工作 ...................................... 38
2.9.2 詳細步驟 ...................................... 38
2.10 生成驗證曲線 ........................................ 40
2.11 生成學習曲線 ........................................ 43
2.12 估算收入階 層 ........................................ 45
第3 章 預測建模 ............................................ 48
3.1 簡介 ............................................ 48
3.2 用SVM 建立線性分類器 ........................ 49
3.2.1 準備工作 ...................................... 49
3.2.2 詳細步驟 ...................................... 50
3.3 用SVM 建立非線性分類器 .................... 53
3.4 解決類型數量不平衡問題 ....................... 55
3.5 提取置信度 .............................................. 58
3.6 尋找最優超參數 ...................................... 60
3.7 建立事件預測器 ...................................... 62
3.7.1 準備工作 ...................................... 62
3.7.2 詳細步驟 ...................................... 62
3.8 估算交通流量 .......................................... 64
3.8.1 準備工作 ...................................... 64
3.8.2 詳細步驟 ...................................... 64
第4 章 無監督學習——聚類....................... 67
4.1 簡介 ....................................... 67
4.2 用k-means 算法聚類數據 ....................... 67
4.3 用矢量量化壓縮圖片 .............................. 70
4.4 建立均值漂移聚類模型 ........................... 74
4.5 用凝聚層次聚類進行數據分組 ............... 76
4.6 評價聚類算法的聚類效果 ....................... 79
4.7 用DBSCAN 算法自動估算集群數量 ..... 82
4.8 探索股票數據的模式 .............................. 86
4.9 建立客戶細分模型 .................................. 88
第5 章 構建推薦引擎 ................................... 91
5.1 簡介 ...................................... 91
5.2 為數據處理構建函式組合 ....................... 92
5.3 構建機器學習流水線 .............................. 93
5.3.1 詳細步驟 ...................................... 93
5.3.2 工作原理 ...................................... 95
5.4 尋找最近鄰 .............................................. 95
5.5 構建一個KNN 分類器 ............................ 98
5.5.1 詳細步驟 ...................................... 98
5.5.2 工作原理 .................................... 102
5.6 構建一個KNN 回歸器 .......................... 102
5.6.1 詳細步驟 .................................... 102
5.6.2 工作原理 .................................... 104
5.7 計算歐氏距離分數 ................................ 105
5.8 計算皮爾遜相關係數 ............................ 106
5.9 尋找數據集中的相似用戶 ..................... 108
5.10 生成電影推薦 ...................................... 109
第6 章 分析文本數據 ................................. 112
6.1 簡介 ....................................... 112
6.2 用標記解析的方法預處理數據 ............. 113
6.3 提取文本數據的詞幹 ............................ 114
6.3.1 詳細步驟 .................................... 114
6.3.2 工作原理 .................................... 115
6.4 用詞形還原的方法還原文本的基本形式 .................... 116
6.5 用分塊的方法劃分文本 ........................ 117
6.6 創建詞袋模型 ........................................ 118
6.6.1 詳細步驟 .................................... 118
6.6.2 工作原理 .................................... 120
6.7 創建文本分類器 .................................... 121
6.7.1 詳細步驟 .................................... 121
6.7.2 工作原理 .................................... 123
6.8 識別性別 ............................................. 124
6.9 分析句子的情感 .................................... 125
6.9.1 詳細步驟 .................................... 126
6.9.2 工作原理 .................................... 128
6.10 用主題建模識別文本的模式 ............... 128
6.10.1 詳細步驟 .................................. 128
6.10.2 工作原理 .................................. 131
第7 章 語音識別 ......................................... 132
7.1 簡介 .......................................... 132
7.2 讀取和繪製音頻數據 ............................ 132
7.3 將音頻信號轉換為頻域 ........................ 134
7.4 自定義參數生成音頻信號 ..................... 136
7.5 合成音樂 .......................................... 138
7.6 提取頻域特徵 ........................................ 140
7.7 創建隱馬爾科夫模型 ............................ 142
7.8 創建一個語音識別器 ............................ 143
第8 章 解剖時間序列和時序數據 ............ 147
8.1 簡介 ............................................. 147
8.2 將數據轉換為時間序列格式 ................. 148
8.3 切分時間序列數據 ................................ 150
8.4 操作時間序列數據 ................................ 152
8.5 從時間序列數據中提取統計數字 ......... 154
8.6 針對序列數據創建隱馬爾科夫模型 ..... 157
8.6.1 準備工作 .................................... 158
8.6.2 詳細步驟 .................................... 158
8.7 針對序列文本數據創建條件隨機場 ..... 161
8.7.1 準備工作 .................................... 161
8.7.2 詳細步驟 .................................... 161
8.8 用隱馬爾科夫模型分析股票市場數據.......................... 164
第9 章 圖像內容分析 ................................. 166
9.1 簡介 .............................................. 166
9.2 用OpenCV-Pyhon 操作圖像 ................. 167
9.3 檢測邊 ........................................ 170
9.4 直方圖均衡化 ........................................ 174
9.5 檢測稜角 .................................. 176
9.6 檢測SIFT 特徵點 .................................. 178
9.7 創建Star 特徵檢測器 ............................ 180
9.8 利用視覺碼本和向量量化創建特徵 ...... 182
9.9 用極 端隨機森林訓練圖像分類器 .......... 185
9.10 創建一個對象識別器 ........................... 187
第 10 章 人臉識別 ........................................ 189
10.1 簡介 ........................................... 189
10.2 從網路攝像頭採集和處理視頻信息 .... 189
10.3 用Haar 級聯創建一個人臉識別器 ...... 191
10.4 創建一個眼睛和鼻子檢測器 ............... 193
10.5 做主成分分析 ...................................... 196
10.6 做核主成分分析 .................................. 197
10.7 做盲源分離 .......................................... 201
10.8 用局部二值模式直方圖創建一個人臉識別器 ................ 205
第 11 章 深度神經網路 ............................... 210
11.1 簡介 ........................................ 210
11.2 創建一個感知器 .................................. 211
11.3 創建一個單層神經網路 ....................... 213
11.4 創建一個深度神經網路 ....................... 216
11.5 創建一個向量量化器........................... 219
11.6 為序列數據分析創建一個遞歸神經網路 ...................... 221
11.7 在光學字元識別資料庫中將字元可視化 ...................... 225
11.8 用神經網路創建一個光學字元識別器 ....................... 226
第 12 章 可視化數據 ................................... 230
12.1 簡介 ............................................... 230
12.2 畫3D 散點圖 ....................................... 230
12.3 畫氣泡圖 ............................................ 232
12.4 畫動態氣泡圖 ...................................... 233
12.5 畫餅圖 ............................................... 235
12.6 畫日期格式的時間序列數據 ............... 237
12.7 畫直方圖 ............................................ 239
12.8 可視化熱力圖 ...................................... 241
12.9 動態信號的可視化模擬 ....................... 242

相關詞條

熱門詞條

聯絡我們