機器學習案例實戰

機器學習案例實戰

《機器學習案例實戰》是2019年12月人民郵電出版社出版的圖書,作者是趙衛東。

基本介紹

  • 中文名:機器學習案例實戰
  • 作者:趙衛東
  • 出版社:人民郵電出版社
  • 出版時間:2019年12月
  • 頁數:283 頁
  • 定價:59.8 元
  • 開本:16 開
  • 裝幀:平裝
  • ISBN:9787115514103
內容簡介,圖書目錄,

內容簡介

機器學習已經廣泛地套用於各行各業,深度學習的興起再次推動了人工智慧的熱潮。本書結合項目實踐,首先討論了TensorFlow、PySpark、TI-ONE等主流機器學習平台的主要特點;然後結合Tableau介紹了數據可視化在銀行客戶用卡行為分析的套用。在此基礎上,利用上述介紹的這些平台,通過多個項目案例,詳細地分析了決策樹、隨機森林、支持向量機、邏輯回歸、貝葉斯網路卷積神經網路、循環神經網路、對抗生成網路等機器學習算法在金融、商業、汽車、電力等領域的套用。
本書內容深入淺出,提供了詳細的 Python 代碼,既可以作為從事機器學習、數據挖掘的相關研究人員的參考書,也可以作為高校相關專業機器學習、數據挖掘等課程的實驗和實訓教材。

圖書目錄

第1章 常用機器學習平台. 1
1.1 常用機器學習工具1
1.2 TI-ONE 平台概述3
1.3 PySpark 介紹4
1.4 TI-ONE 機器學習平台主要的組件5
1.4.1 數據源組件 5
1.4.2 機器學習組件 6
1.4.3 輸出組件10
1.4.4 模型評估組件 11
第 2章 銀行信用卡風險的可視化分析. 12
2.1 Tableau 簡介13
2.2 用戶信用等級影響因素13
2.3 用戶消費情況對信用等級的影響.19
2.4 用戶拖欠情況對信用等級的影響.24
2.5 欺詐用戶特徵分析27
第3章 貸款違約行為預測. 31
3.1 建立信用評估模型的必要性31
3.2 數據準備與預處理32
3.2.1 原始數據集 33
3.2.2 基礎表數據預處理 36
3.2.3 多表合併40
3.3 模型選擇.42
3.3.1 帶正則項的Logistic 回歸模型 42
3.3.2 樸素貝葉斯模型 42
3.3.3 隨機森林模型 42
3.3.4 SVM 模型 43
3.4 TI-ONE 整體流程43
3.4.1 登錄TI-ONE 44
3.4.2 輸入工作流名稱 44
3.4.3 上傳數據 45
3.4.4 數據預處理 46
3.4.5 拆分出驗證集 50
3.4.6 拆分出測試集 51
3.4.7 模型訓練和評估 51
第4章 保險風險預測.61
4.1 背景介紹 61
4.2 數據預處理63
4.2.1 數據載入與預覽 63
4.2.2 缺失值處理 64
4.2.3 屬性值的合併與連線 65
4.2.4 數據轉換 66
4.2.5 數據標準化和歸一化 67
4.3 多維分析.67
4.4 基於神經網路模型預測保險風險.70
4.5 使用SVM 預測保險風險.74
第5章 銀行客戶流失預測 80
5.1 問題描述 80
5.2 數據上傳.82
5.3 數據預處理83
5.3.1 非數值特徵處理 83
5.3.2 數據離散化處理 83
5.3.3 數據篩選 85
5.3.4 數據格式轉化 86
5.3.5 數據分割 87
5.4 數據建模 88
5.5 模型校驗評估 91
5.5.1 二分類算法評估 91
5.5.2 ROC 曲線繪製. 92
5.5.3 決策樹參數最佳化 94
5.5.4 k 折交叉驗證. 95
5.6 工作流的運行.95
5.7 算法性能比較.98
第6章 基於深度神經網路的股票預測 100
6.1 股票趨勢預測的背景和分析思路100
6.2 數據提取.103
6.3 數據預處理103
6.3.1 數據歸一化103
6.3.2 加窗處理104
6.3.3 分割數據集106
6.3.4 標籤獨熱編碼轉化106
6.4 模型訓練.106
6.5 算法評估.110
6.6 算法比較.111
第7章 保險產品推薦119
7.1 保險產品推薦的流程.120
7.2 數據提取.121
7.2.1 上傳原始檔案 121
7.2.2 讀取訓練集和檢驗集 122
7.3 數據預處理124
7.3.1 去重和合併數據集124
7.3.2 缺失值處理 125
7.3.3 特徵選擇 126
7.3.4 類型變數獨熱編碼 127
7.3.5 數值變數規範化 127
7.3.6 生成訓練集和檢驗集 128
7.4 構建保險預測模型129
7.5 模型評估.131
第8章 零售商品銷售預測. 133
8.1 問題分析.133
8.2 數據探索.135
8.2.1 上傳原始數據 135
8.2.2 數據質量評估 136
8.3 數據預處理139
8.3.1 填補缺失值 139
8.3.2 修正異常值 140
8.3.3 衍生欄位 141
8.3.4 類型變數數值化和獨熱編碼化 142
8.3.5 數據導出 143
8.4 建立銷售量預測模型.143
8.4.1 線性回歸模型 144
8.4.2 Ridge 回歸模型. 145
8.4.3 Lasso 回歸模型. 145
8.4.4 Elastic Net 回歸模型. 146
8.4.5 決策樹回歸模型 146
8.4.6 梯度提升樹回歸模型 147
8.4.7 隨機森林回歸模型 148
8.5 模型評估.148
第9章 汽車備件銷售預測. 151
9.1 數據理解.151
9.2 數據分析流程.152
9.2.1 設定數據源 152
9.2.2 數據預處理 155
9.2.3 建模分析與評估 158
9.3 聚類分析.162
第 10章 火力發電廠工業蒸汽量預測.166
10.1 確定業務問題.166
10.2 數據理解.166
10.3 工業蒸汽量的預測建模過程167
10.3.1 設定數據源 168
10.3.2 數據預處理 168
10.3.3 建模分析與評估 172
第 11章 圖片風格轉化.179
11.1 CycleGAN 原理.180
11.2 圖片風格轉化整體流程182
11.2.1 設定數據源 183
11.2.2 數據預處理184
11.2.3 模型訓練 186
11.2.4 驗證模型參數以及測試集 193
11.2.5 模型測試——轉化圖片風格194
11.3 運行工作流195
11.4 算法比較.198
11.4.1 CycleGAN 與pix2pix 模型. 198
11.4.2 CycleGAN 與DistanceGAN 模型 198
11.5 使用TensorFlow 實現圖片風格轉化.199
第 12章 人類活動識別.206
12.1 問題分析.206
12.2 數據探索.207
12.3 數據預處理209
12.4 模型構建.210
12.5 模型評估.214
第 13章 GRU 算法在基於Session 的推薦系統的套用 221
13.1 問題分析.221
13.2 數據探索與預處理222
13.2.1 數據變換 223
13.2.2 數據過濾 223
13.2.3 數據分割 223
13.2.4 格式轉換224
13.3 構建GRU 模型225
13.3.1 GRU 概述 225
13.3.2 構建GRU 推薦模型. 226
13.4 模型評估.229
第 14章 人臉老化預測 233
14.1 問題分析與數據集簡介233
14.2 圖片編碼與GAN 設計.234
14.3 模型實現.235
14.4 實驗分析.236
第 15章 計程車軌跡數據分析 243
15.1 數據獲取.244
15.2 數據預處理246
15.3 數據分析.252
15.3.1 計程車區域推薦以及交通管理建議 252
15.3.2 城市規劃建議 257
第 16章 城市聲音分類.261
16.1 數據準備與探索261
16.2 數據特徵提取.268
16.3 構建城市聲音分類模型271
16.3.1 使用MLP 訓練聲音分類模型 271
16.3.2 使用LSTM 與GRU 網路訓練聲音分類模型. 273
16.3.3 使用CNN 訓練聲音分類模型 274
16.4 聲音分類模型評估275
16.4.1 MLP 網路性能評估 275
16.4.2 LSTM 與GRU 網路性能評估. 276
16.4.3 CNN 性能評估 277
後記 數據分析技能培養 279
參考文獻. 282

相關詞條

熱門詞條

聯絡我們