機器學習入門之道

機器學習入門之道

《機器學習入門之道》是2019年5月人民郵電出版社出版的圖書,作者是[日]中井悅司。

基本介紹

  • 書名:機器學習入門之道
  • 作者:[日]中井悅司
  • ISBN:9787115479341
  • 頁數:201頁
  • 定價:59元
  • 出版社:人民郵電出版社
  • 出版時間:2019年5月
  • 裝幀:平裝
  • 開本:小16開
內容簡介,圖書目錄,

內容簡介

人工智慧正在形成一股新的浪潮,它將從技術、經濟、社會等各個層面改變我們的工作和生活方式。作為實現人工智慧的重要技術,機器學習正在受到人工智慧專家之外的更廣泛人群的關注,想要了解機器學習相關知識和技術的人日益增多。
本書緊緊圍繞“機器學習的商業套用”這個主題,從數學原理上解釋了機器學習的一些基礎算法,如最小二乘法、最優推斷法、感知器、Logistic回歸、K均值算法、EM算法、貝葉斯推斷等。全書的主旨在於幫助讀者理解機器學習的本質,因此作者介紹具體的例題時,基本的著眼點是教會讀者使用什麼樣的思維方式,以及如何進行計算,為讀者探索更加複雜的深度學習領域或神經網路算法打下堅實的基礎。

圖書目錄

第1章 數據科學和機器學習 1
1.1 數據科學在商業領域中的作用 2
1.2 機器學習算法的分類 8
1.2.1 分類:產生類判定的算法 8
1.2.2 回歸分析:預測數值的算法 9
1.2.3 聚類分析:對數據進行無監督群組化的算法 10
1.2.4 其他算法 12
1.3 本書使用的例題 13
1.3.1 基於回歸分析的觀測值推斷 13
1.3.2 基於線性判別的新數據分類 17
1.3.3 圖像檔案的褪色處理(提取代表色) 18
1.3.4 識別手寫文字 19
1.4 分析工具的準備 20
1.4.1 本書使用的數據分析工具 21
1.4.2 運行環境設定步驟(以CentOS 6為例) 22
1.4.3 運行環境設定步驟(以Mac OS X為例) 25
1.4.4 運行環境設定步驟(以Windows 7/8.1為例) 27
1.4.5 IPython的使用方法 30
第 2章 最小二乘法:機器學習理論第 一步 35
2.1 基於近似多項式和最小二乘法的推斷 36
2.1.1 訓練集的特徵變數和目標變數 36
2.1.2 近似多項式和誤差函式的設定 38
2.1.3 誤差函式最小化條件 39
2.1.4 示例代碼的確認 42
2.1.5 統計模型的最小二乘法 46
2.2 過度擬合檢出 49
2.2.1 訓練集和測試集 49
2.2.2 測試集的驗證結果 50
2.2.3 基於交叉檢查的泛化能力驗證 52
2.2.4 基於數據的過度擬合變化 54
2.3 附錄:Hessian矩陣的特性 56
第3章 最優推斷法:使用機率的推斷理論 59
3.1 機率模型的利用 60
3.1.1 “數據的產生機率”設定 60
3.1.2 基於似然函式的參數評價 65
3.1.3 示例代碼的確認 69
3.2 使用簡化示例的解釋說明 73
3.2.1 常態分配的參數模型 74
3.2.2 示例代碼的確認 76
3.2.3 推斷量的評價方法(一致性和無偏性) 78
3.3 附錄:樣本均值及樣本方差一致性和無偏性的證明 80
3.3.1 樣本均值及樣本方差一致性和無偏性的證明 81
3.3.2 示例代碼的確認 85
第4章 感知器:分類算法的基礎 89
4.1 機率梯度下降法的算法 91
4.1.1 分割平面的直線方程 91
4.1.2 基於誤差函式的分類結果評價 93
4.1.3 基於梯度的參數修正 95
4.1.4 示例代碼的確認 99
4.2 感知器的幾何學解釋 100
4.2.1 對角項的任意性和算法的收斂速度 101
4.2.2 感知器的幾何學解釋 103
4.2.3 對角項的幾何學意義 104
第5章 Logistic回歸ROC曲線:學習模型的評價方法 107
5.1 對分類問題套用最優推斷法 108
5.1.1 數據發生機率的設定 108
5.1.2 基於最優推斷法的參數確定 112
5.1.3 示例代碼的確認 114
5.2 基於ROC曲線的學習模型評價 117
5.2.1 Logistic回歸在實際問題中的套用 118
5.2.2 基於ROC曲線的性能評價 120
5.2.3 示例代碼的確認 123
5.3 附錄:IRLS法的推導 126
第6章 K均值算法:無監督學習模型的基礎 133
6.1 基於K均值算法的聚類分析和套用實例 134
6.1.1 無監督學習模型類聚類分析 134
6.1.2 基於K均值算法的聚類分析 135
6.1.3 在圖像數據方面的套用 138
6.1.4 示例代碼的確認 141
6.1.5 K均值算法的數學依據 143
6.2 “懶惰”學習模型K近鄰法 146
6.2.1 基於K近鄰法的分類 146
6.2.2 K近鄰法的問題 148
第7章 EM算法:基於最優推斷法的監督學習 151
7.1 使用伯努利分布的最優推斷法 152
7.1.1 手寫文字的合成方法 153
7.1.2 基於圖像生成器的最優推斷法套用 154
7.2 使用混合分布的最優推斷法 157
7.2.1 基於混合分布的機率計算 157
7.2.2 EM算法的過程 158
7.2.3 示例代碼的確認 161
7.2.4 基於聚類分析的探索性數據解析 165
7.3 附錄:手寫文字數據的採集方法 167
第8章 貝葉斯推斷:以數據為基礎提高置信度的手法 169
8.1 貝葉斯推斷模型和貝葉斯定理 170
8.1.1 貝葉斯推斷的思路 171
8.1.2 貝葉斯定理入門 172
8.1.3 使用貝葉斯推斷確定常態分配:推斷參數 178
8.1.4 使用貝葉斯推斷確定常態分配:推斷觀測值分布 185
8.1.5 示例代碼的確認 188
8.2 貝葉斯推斷回歸分析的套用 190
8.2.1 參數後期分布的計算 190
8.2.2 觀測值分布的推斷 194
8.2.3 示例代碼的確認 195
8.3 附錄:最優推斷法和貝葉斯推斷的關係 198
後記 201

相關詞條

熱門詞條

聯絡我們