《機器學習實踐套用》是人民出版社於2017年7月出版的圖書,作者李博。書中通過將機器學習算法與實際業務場景結合,讓讀者可以快速入門並使用高深的算法。在本書中,對整個數據挖掘的流程都進行了詳細的介紹,包括數據預處理、特徵工程、機器學習與深度學習算法、機器學習常用工具、真實案例、知識圖譜等章節。
基本介紹
- 書名:機器學習實踐套用
- 作者:李博
- ISBN:9787115460417
- 類別:人工智慧
- 頁數:280
- 定價:69
- 出版社:人民郵電出版社
- 出版時間:2017年7月
- 裝幀:平裝
- 開本:16開
內容簡介,作者簡介,目錄,
內容簡介
機器學習是一門多領域交叉學科,涉及機率論、統計學、逼近論、凸分析、算法複雜度等多門學科,專門研究計算機怎樣模擬或實現人類的學習行為。機器學習是人工智慧的核心,是使計算機具有智慧型的根本途徑。本書通過對機器學習的背景知識、算法流程、相關工具、實踐案例以及知識圖譜等內容的講解,全面介紹了機器學習的理論基礎和實踐套用。書中涉及機器學習領域的多個典型算法,並詳細給出了機器學習的算法流程。本書適合任何有一定數據功底和編程基礎的讀者閱讀。通過閱讀本書,讀者不僅可以了解機器學習的理論基礎,也可以參照一些典型的套用案例拓展自己的專業技能。同時,本書也適合計算機相關專業的學生以及對人工智慧和機器學習感興趣的讀者閱讀。
作者簡介
李博,目前任阿里雲數據產品經理,主要負責機器學習平台的產品化建設以及對外業務套用。本科、碩士畢業於北京郵電大學,曾就職於索尼和華為(實習),從事數據相關產品的開發。作為CSDN部落格專家、雲棲社區部落格專家,長期分享IT技術相關文章,內容涉及機器學習算法、Android套用及源碼開發等領域。一直活躍於開發者社區,主導開發了多個GitHub百星開源項目,還開發並上線了多款手機App。
目錄
第1部分 背景知識
第1章 機器學習概述 3
1.1 背景 3
1.2 發展現狀 6
1.2.1 數據現狀 6
1.2.2 機器學習算法現狀 8
1.3 機器學習基本概念 12
1.3.1 機器學習流程 12
1.3.2 數據源結構 14
1.3.3 算法分類 16
1.3.4 過擬合問題 18
1.3.5 結果評估 20
1.4 本章小結 22
第2部分 算法流程
第2章 場景解析 25
2.1 數據探查 25
2.2 場景抽象 27
2.3 算法選擇 29
2.4 本章小結 31
第3章 數據預處理 32
3.1 採樣 32
3.1.1 隨機採樣 32
3.1.2 系統採樣 34
3.1.3 分層採樣 35
3.2 歸一化 36
3.3 去除噪聲 39
3.4 數據過濾 42
3.5 本章小結 43
第4章 特徵工程 44
4.1 特徵抽象 44
4.2 特徵重要性評估 49
4.3 特徵衍生 53
4.4 特徵降維 57
4.4.1 特徵降維的基本概念 57
4.4.2 主成分分析 59
4.5 本章小結 62
第5章 機器學習算法——常規算法 63
5.1 分類算法 63
5.1.1 K近鄰 63
5.1.2 樸素貝葉斯 68
5.1.3 邏輯回歸 74
5.1.4 支持向量機 81
5.1.5 隨機森林 87
5.2 聚類算法 94
5.2.1 K-means 97
5.2.2 DBSCAN 103
5.3 回歸算法 109
5.4 文本分析算法 112
5.4.1 分詞算法——Hmm 112
5.4.2 TF-IDF 118
5.4.3 LDA 122
5.5 推薦類算法 127
5.6 關係圖算法 133
5.6.1 標籤傳播 134
5.6.2 Dijkstra最短路徑 138
5.7 本章小結 145
第6章 機器學習算法——深度學習 146
6.1 深度學習概述 146
6.1.1 深度學習的發展 147
6.1.2 深度學習算法與傳統
算法的比較 148
6.2 深度學習的常見結構 152
6.2.1 深度神經網路 152
6.2.2 卷積神經網路 153
6.2.3 循環神經網路 156
6.3 本章小結 157
第3部分 工具介紹
第7章 常見機器學習工具介紹 161
7.1 概述 161
7.2 單機版機器學習工具 163
7.2.1 SPSS 163
7.2.2 R語言 167
7.2.3 工具對比 172
7.3 開源分散式機器學習工具 172
7.3.1 Spark MLib 172
7.3.2 TensorFlow 179
7.4 企業級雲機器學習工具 190
7.4.1 亞馬遜AWS ML 191
7.4.2 阿里雲機器學習PAI 196
7.5 本章小結 205
第4部分 實戰套用
第8章 業務解決方案 209
8.1 心臟病預測 209
8.1.1 場景解析 209
8.1.2 實驗搭建 211
8.1.3 小結 216
8.2 商品推薦系統 216
8.2.1 場景解析 217
8.2.2 實驗搭建 218
8.2.3 小結 220
8.3 金融風控案例 220
8.3.1 場景解析 221
8.3.2 實驗搭建 222
8.3.3 小結 225
8.4 新聞文本分析 225
8.4.1 場景解析 225
8.4.2 實驗搭建 226
8.4.3 小結 230
8.5 農業貸款發放預測 230
8.5.1 場景解析 230
8.5.2 實驗搭建 232
8.5.3 小結 236
8.6 霧霾天氣成因分析 236
8.6.1 場景解析 237
8.6.2 實驗搭建 238
8.6.3 小結 243
8.7 圖片識別 243
8.7.1 場景解析 243
8.7.2 實驗搭建 245
8.7.3 小結 253
8.8 本章小結 253
第5部分 知識圖譜
第9章 知識圖譜 257
9.1 未來數據採集 257
9.2 知識圖譜的概述 259
9.3 知識圖譜開源
工具 261
9.4 本章小結 264
參考文獻 265
編輯推薦