機器學習Python版

《機器學習Python版》是2022年機械工業出版社出版的圖書。

基本介紹

  • 中文名:機器學習Python版
  • 出版時間:2022年7月1日
  • 出版社:機械工業出版社
  • ISBN:9787111706007
內容簡介,圖書目錄,

內容簡介

本書將幫助讀者掌握開發有效學習系統所需的流程、模式和策略,通過簡單的故事、圖片和Python示例來向讀者傳達機器學習的基本思想。即使讀者是一名初學者,只要具備一些Python編程基礎,不管大學數學水平如何,都能輕鬆閱讀本書並有所收穫。

圖書目錄

譯者序
推薦序
前言
作者簡介
第一部分 機器學習入門
第1章 機器學習概論 2
1.1 歡迎來到機器學習的世界 2
1.2 範圍、術語、預測和數據 3
1.2.1 特徵 4
1.2.2 目標值和預測值 5
1.3 讓機器開始機器學習 6
1.4 學習系統舉例 8
1.4.1 預測類別:分類器舉例 8
1.4.2 預測值:回歸器舉例 9
1.5 評估機器學習系統 10
1.5.1 準確率 10
1.5.2 資源消耗 11
1.6 創建機器學習系統的過程 12
1.7 機器學習的假設和現實 13
1.8 本章參考閱讀資料 15
1.8.1 本書內容 15
1.8.2 章節注釋 16
第2章 相關技術背景 18
2.1 編程環境配置 18
2.2 數學語言的必要性 18
2.3 用於解決機器學習問題的軟體 19
2.4 機率 20
2.4.1 基本事件 21
2.4.2 獨立性 22
2.4.3 條件機率 23
2.4.4 機率分布 24
2.5 線性組合、加權和以及點積 27
2.5.1 加權平均 29
2.5.2 平方和 31
2.5.3 誤差平方和 32
2.6 幾何視圖:空間中的點 33
2.6.1 直線 33
2.6.2 直線拓展 37
2.7 表示法和加1技巧 41
2.8 漸入佳境:突破線性和非線性 42
2.9 NumPy與“數學無所不在” 45
2.10 浮點數問題 49
2.11 本章參考閱讀資料 50
2.11.1 本章小結 50
2.11.2 章節注釋 51
第3章 預測類別:分類入門 52
3.1 分類任務 52
3.2 一個簡單的分類數據集 53
3.3 訓練和測試:請勿應試教育 55
3.4 評估:考試評分 58
3.5 簡單分類器#1:最近鄰分類器、遠距離關係和假設 59
3.5.1 定義相似性 60
3.5.2 k?-最近鄰中的k 61
3.5.3 答案組合 61
3.5.4 k?-最近鄰、參數和非參數方法 61
3.5.5 建立一個k?-最近鄰分類模型 62
3.6 簡單分類器#2:樸素貝葉斯分類器、
 機率和違背承諾 64
3.7 分類器的簡單評估 66
3.7.1 機器學習的性能 66
3.7.2 分類器的資源消耗 67
3.7.3 獨立資源評估 73
3.8 本章參考閱讀資料 77
3.8.1 局限性和尚未解決的問題 77
3.8.2 本章小結 77
3.8.3 章節注釋 77
3.8.4 練習題 79
第4章 預測數值:回歸入門 80
4.1 一個簡單的回歸數據集 80
4.2 最近鄰回歸和匯總統計 82
4.2.1 中心度量方法:中位數和均值 83
4.2.2 構建一個k?-最近鄰回歸模型 85
4.3 線性回歸和誤差 86
4.3.1 地面總是不平坦的:為什麼需要斜坡 86
4.3.2 傾斜直線 89
4.3.3 執行線性回歸 91
4.4 最佳化:選擇最佳答案 92
4.4.1 隨機猜測 92
4.4.2 隨機調整 93
4.4.3 智慧型調整 94
4.4.4 計算的捷徑 94
4.4.5 線性回歸的套用 95
4.5 回歸器的簡單評估和比較 95
4.5.1 均方根誤差 95
4.5.2 機器學習的性能 96
4.5.3 回歸過程中的資源消耗 96
4.6 本章參考閱讀資料 98
4.6.1 局限性和尚未解決的問題 98
4.6.2 本章小結 99
4.6.3 章節注釋 99
4.6.4 練習題 99
第二部分 通用評估技術
第5章 機器學習算法的評估和比較分析 102
5.1 評估和大道至簡的原則 102
5.2 機器學習階段的術語 103
5.2.1 有關機器的重新討論 104
5.2.2 更規範的闡述 106
5.3 過擬合和欠擬合 109
5.3.1 合成數據和線性回歸 109
5.3.2 手動操控模型的複雜度 111
5.3.3 金鳳花姑娘(“恰到好處”原則):可視化過擬合、欠擬合和“最佳擬合” 112
5.3.4 簡單性 115
5.3.5 關於過擬合必須牢記的注意事項 116
5.4 從誤差到成本 116
5.4.1 損失 116
5.4.2 成本 117
5.4.3 評分 118
5.5 (重新)抽樣:以少勝多 119
5.5.1 交叉驗證 119
5.5.2 分層抽樣 122
5.5.3 重複的訓練-測試集拆分 124
5.5.4 一種更好的方法和混排 127
5.5.5 留一交叉驗證 131
5.6 分解:將誤差分解為偏差和方差 132
5.6.1 數據的方差 133
5.6.2 模型的方差 133
5.6.3 模型的偏差 134
5.6.4 結合所有的因素 134
5.6.5 偏差-方差權衡示例 135
5.7 圖形可視化評估和比較 139
5.7.1 學習曲線:到底需要多少數據 139
5.7.2 複雜度曲線 141
5.8 使用交叉驗證比較機器學習模型 143
5.9 本章參考閱讀資料 144
5.9.1 本章小結 144
5.9.2 章節注釋 144
5.9.3 練習題 146
第6章 評估分類器 147
6.1 基線分類器 147
6.2 準確率以外:分類器的其他度量指標 149
6.2.1 從混淆矩陣中消除混淆 151
6.2.2 錯誤的方式 151
6.2.3 基於混淆矩陣的度量指標 152
6.2.4 混淆矩陣編碼 154
6.2.5 處理多元類別:多元類別平均 156
……

相關詞條

熱門詞條

聯絡我們