機器學習領域經典著作,智慧型計算專家多年經驗結晶,以全新的角度詮釋機器學習的算法理論,通過案例系統闡述機器學習的實踐方法和套用技巧,指導讀者輕鬆步入工程套用階段,也是為數不多的既有大量實踐套用案例又包含算法理論剖析的著作,作者針對機器學習算法既抽象複雜又涉及多門數學學科的特點,力求理論聯繫實際,始終以算法套用為主線,由淺入深以全新的角度詮釋機器學習。
《機器學習實踐指南:案例套用解析》分為準備篇、基礎篇、統計分析實戰篇和機器學習實戰篇。準備篇介紹了機器學習的發展及套用前景以及常用科學計算平台,主要包括統計分析語言r、機器學習模組mlpy和neurolab、科學計算平台numpy、圖像識別軟體包opencv、網頁分析beautifulsoup等軟體的安裝與配置。基礎篇先對數學基礎及其在機器學習領域的套用進行講述,同時推薦配套學習的數學書籍,然後運用實例說明計算平台的使用,以python和r為實現語言,重點講解了圖像算法、信息隱藏、最小二乘法擬合、因子頻率分析、歐氏距離等,告訴讀者如何使用計算平台完成工程套用。最後,通過大量統計分析和機器學習案例提供實踐指南,首先講解回歸分析、區間分布、數據圖形化、分布趨勢、常態分配、分布擬合等數據分析基礎,然後講解神經網路、統計算法、歐氏距離、餘弦相似度、線性與非線性回歸、數據擬合、線性濾波、圖像識別、人臉辨識、網頁分類等機器學習算法。此書可供算法工程師、it專業人員以及機器學習愛好者參考使用。
基本介紹
- 書名:機器學習實踐指南
- 作者:麥好
- ISBN:9787111462071
- 類別:人工智慧與數據挖掘
- 頁數:323
- 定價:69元
- 出版社:機械工業出版社
- 出版時間:2014-04-01
- 裝幀:精裝
第一部分 準備篇
第1章 機器學習發展及套用前景 2
1.1 機器學習概述 2
1.1.1 什麼是機器學習 3
1.1.2 機器學習的發展 3
1.1.3 機器學習的未來 4
1.2 機器學習套用前景 5
1.2.1 數據分析與挖掘 5
1.2.2 模式識別 5
1.2.3 更廣闊的領域 6
1.3 小結 7
第2章 科學計算平台 8
2.1 科學計算軟體平台概述 8
2.1.1 常用的科學計算軟體 9
2.1.2 本書使用的工程計算平台 10
2.2 計算平台的配置 11
2.2.1 numpy等python科學計算包的安裝與配置 11
2.2.2 opencv 安裝與配置 13
.2.2.3 mlpy 安裝與配置 14
2.2.4 beautifulsoup安裝與配置 15
2.2.5 neurolab安裝與配置 15
2.2.6 r安裝與配置 15
2.3 小結 16
第二部分 基礎篇
第3章 機器學習數學基礎 18
3.1 數學對我們有用嗎 18
3.2 機器學習需要哪些數學知識 20
3.3 小結 25
第4章 計算平台套用實例 26
4.1 python計算平台簡介及套用實例 26
4.1.1 python語言基礎 26
4.1.2 numpy庫 37
4.1.3 pylab、matplotlib繪圖 44
4.1.4 圖像基礎 46
4.1.5 圖像融合與圖像鏡像 55
4.1.6 圖像灰度化與圖像加噪 57
4.1.7 聲音基礎 60
4.1.8 聲音音量調節 63
4.1.9 圖像信息隱藏 68
4.1.10 聲音信息隱藏 72
4.2 r語言基礎 78
4.2.1 基本操作 78
4.2.2 向量 81
4.2.3 對象集屬性 87
4.2.4 因子和有序因子 88
4.2.5 循環語句 89
4.2.6 條件語句 89
4.3 r語言科學計算 90
4.3.1 分類(組)統計 90
4.3.2 數組與矩陣基礎 91
4.3.3 數組運算 94
4.3.4 矩陣運算 95
4.4 r語言計算實例 103
4.4.1 學生數據集讀寫 103
4.4.2 最小二乘法擬合 105
4.4.3 交叉因子頻率分析 106
4.4.4 向量模長計算 107
4.4.5 歐氏距離計算 108
4.5 小結 109
思考題 109
第三部分 統計分析實戰篇
第5章 統計分析基礎 112
5.2 數學基礎 113
5.3 回歸分析 118
5.3.1 單變數線性回歸 118
5.3.2 多元線性回歸 121
5.3.3 非線性回歸 121
5.4 數據分析基礎 124
5.4.1 區間頻率分布 124
5.4.2 數據直方圖 126
5.4.3 數據散點圖 127
5.4.4 五分位數 129
5.4.5 累積分布函式 130
5.4.6 核密度估計 130
5.5 數據分布分析 132
5.6 小結 134
思考題 135
第6章 統計分析案例 136
6.1 數據圖形化案例解析 136
6.1.1 點圖 136
6.1.2 餅圖和條形圖 137
6.1.3 莖葉圖和箱線圖 138
6.2 數據分布趨勢案例解析 140
6.2.1 平均值 140
6.2.2 加權平均值 140
6.2.3 數據排序 141
6.2.4 中位數 142
6.2.5 極差、半極差 142
6.2.6 方差 143
6.2.7 標準差 143
6.2.8 變異係數、樣本平方和 143
6.2.9 偏度係數、峰度係數 144
6.3 常態分配案例解析 145
6.3.1 常態分配函式 145
6.3.2 峰度係數分析 146
6.3.3 累積分布機率 146
6.3.4 機率密度函式 147
6.3.5 分位點 148
6.3.6 頻率直方圖 151
6.3.7 核機率密度與正態機率分布圖 151
6.3.8 正太檢驗與分布擬合 152
6.3.9 其他分布及其擬合 154
6.4 小結 155
思考題 155
第四部分 機器學習實戰篇
第7章 機器學習算法 158
7.1 神經網路 158
7.1.1 rosenblatt感知器 159
7.1.2 梯度下降 173
7.1.3 反向傳播與多層感知器 180
7.1.4 python神經網路庫 199
7.2 統計算法 201
7.2.1 平均值 201
7.2.2 方差與標準差 203
7.2.3 貝葉斯算法 205
7.3 歐氏距離 208
7.4 餘弦相似度 209
7.5 svm 210
7.5.1 數學原理 210
7.5.2 smo算法 212
7.5.3 算法套用 212
7.6 回歸算法 217
7.6.1 線性代數基礎 217
7.6.2 最小二乘法原理 218
7.6.3 線性回歸 219
7.6.4 多元非線性回歸 221
7.6.5 嶺回歸方法 223
7.6.6 偽逆方法 224
7.7 pca降維 225
7.8 小結 227
思考題 227
第8章 數據擬合案例 228
8.1 數據擬合 228
8.1.1 圖像分析法 228
8.1.2 神經網路擬合法 240
8.2 線性濾波 256
8.2.1 wav聲音檔案 256
8.2.2 線性濾波算法過程 256
8.2.3 濾波python實現 257
8.3 小結 262
思考題 262
第9章 圖像識別案例 264
9.1 圖像邊緣算法 264
9.1.1 數字圖像基礎 264
9.1.2 算法描述 265
9.2 圖像匹配 266 9.2.1 差分矩陣求和 267
9.2.2 差分矩陣均值 269
9.2.3 歐氏距離匹配 271
9.3 圖像分類 277
9.3.1 餘弦相似度 277
9.3.2 pca圖像特徵提取算法 283
9.3.3 基於神經網路的圖像分類 284
9.3.4 基於svm的圖像分類 289
9.4 人臉辨識 291
9.4.1 人臉定位 291
9.4.2 人臉辨識 293
9.5 手寫數字識別 300
9.5.1 手寫數字識別算法 300
9.5.2 算法的python實現 301
9.6 小結 303
思考題 304
第10章 文本分類案例 305
10.1 文本分類概述 305
10.2 餘弦相似度分類 306
10.2.1 中文分詞 306
10.2.2 停用詞清理 308
10.2.3 算法實戰 310
10.3 樸素貝葉斯分類 315
10.3.1 算法描述 316
10.3.2 先驗機率計算 316
10.3.3 最大後驗機率 316
10.3.4 算法實現 317
10.4 小結 323
思考題 323