Python機器學習系統構建(原書第3版)

《Python機器學習系統構建(原書第3版)》是由2020年11月機械工業出版社出版的圖書。

基本介紹

  • 中文名:Python機器學習系統構建(原書第3版)
  • 作者:路易斯·佩德羅·科埃略, 威力·里克特,馬蒂厄·布魯切爾
  • 出版社:機械工業出版社
  • ISBN:9787111669234 
內容簡介,圖書目錄,

內容簡介

本書涉及近期機器學習領域內的*新進展,通過對常用數據集的轉換和工具庫的使用,幫助構建實用的機器學習系統。內容包括如何在原始數據中準確發掘出模式。先從回顧Python機器學習的知識開始,接著了解相關的工具庫。可以快速掌握數據集上真實的項目,掌握建模方法,創建推薦系統。
全書共14章。第1章介紹機器學習和Python基礎知識;第2章使用真實數據進行分類研究;第3章解釋如何使用回歸算法處理數據;第4章介紹如何使用logistic回歸來確定某個問題的用戶答案好不好;第5章介紹數據降維技術;第6章介紹聚類,並使用它來查找給定文本的類似新聞報導;第7章介紹如何建立基於客戶產品評級的推薦系統;第8章介紹神經網路和深度學習相關的基本原理,以及使用TensorFlow進行CNN和RNN的示例;第9章解釋樸素貝葉斯的工作原理,以及如何用它對tweet進行分類;第10章介紹主題建模;第11章和第12章分別講解如何對音樂和圖像進行分類;第13章探索強化學習方法;第14章介紹如何利用雲技術來構建更複雜的模型。

圖書目錄

前言
第1章 Python機器學習入門1
1.1 機器學習和Python—夢之隊1
1.1.1 本書涵蓋的和未涵蓋的內容2
1.1.2 如何好地閱讀本書3
1.1.3 遇到困難怎么辦4
1.1.4 入門指南5
1.1.5 機器學習基礎10
1.1.6 個機器學習的小套用11
1.2 小結23
第2章 使用現實示例進行分類24
2.1 鳶尾花數據集24
2.1.1 可視化是一個很好的開始25
2.1.2 用scikit-learn分類25
2.1.3 建立我們的個分類模型26
2.2 評估—留出數據和交叉驗證27
2.3 如何測量和比較分類器29
2.4 更複雜的數據集和近鄰分類器30
2.4.1 了解種子數據集30
2.4.2 特徵和特徵工程 31
2.4.3 近鄰分類31
2.4.4 查看決策邊界32
2.5 使用哪個分類器35
2.6 小結35
第3章 回歸37
3.1 用回歸方法預測房價走勢37
3.2 多維屬性回歸40
3.3 回歸中的交叉驗證41
3.3.1 懲罰化或正則化回歸42
3.3.2 L1和L2懲罰項42
3.4 在scikit-learn中使用Lasso或 ElasticNet43
3.4.1 Lasso路徑的可視化44
3.4.2 P-greater-than-N場景45
3.4.3 一個基於文本文檔的例子45
3.4.4 主流的超參設定方法47
3.5 用TensorFlow實現回歸50
3.6 小結54
第4章 分類Ⅰ—檢測劣質答案55
4.1 本章概覽55
4.2 學習分類優質答案56
4.2.1 數據實例調整56
4.2.2 分類器調優56
4.3 數據獲取56
4.3.1 將數據轉換為可用的數據塊58
4.3.2 屬性的預選擇和處理58
4.3.3 定義什麼是優質答案59
4.4 創建我們的個分類器60
4.4.1 特徵工程60
4.4.2 訓練分類器61
4.4.3 評價分類器的性能62
4.4.4 設計更多的特徵62
4.5 如何改進性能65
4.5.1 偏置、方差和它們之間的平衡66
4.5.2 修復高偏置66
4.5.3 修復高方差66
4.5.4 高偏置還是低偏置67
4.6 使用logistic回歸69
4.6.1 用一個小例子了解一些數學原理69
4.6.2 將logistic回歸用於我們的帖子分類問題71
4.7 探索準確率背後的細節—精度和召回73
4.8 為分類器減負75
4.9 整合分類器76
4.10 用TensorFlow分類77
4.11 小結82
第5章 降維83
5.1 本章概覽83
5.2 選擇特徵84
5.2.1 使用過濾器檢測冗餘特徵84
5.2.2 使用包裝法從模型中查詢特徵90
5.2.3 其他特徵選擇方法93
5.3 特徵投影93
5.3.1 主成分分析93
5.3.2 PCA的局限性以及LDA如何提供幫助95
5.4 多維縮放96
5.5 用於降維的自動編碼器或神經網路99
5.6 小結103
第6章 聚類—查找相關帖子105
6.1 測量帖子間的相關性 105
6.1.1 不應該這么做106
6.1.2 應該怎么做106
6.2 預處理—將測量的相似性作為常用詞的相似數量107
6.2.1 將原始文本轉換成詞袋107
6.2.2 我們的成就和目標115
6.3 聚類116
6.3.1 K-means 116
6.3.2 獲取測試數據以評估我們的想法119
6.3.3 聚類帖子120
6.4 解決初的挑戰120
6.5 調整參數123
6.6 小結123
第7章 推薦系統125
7.1 評級預測和推薦125
7.2 切分訓練集和測試集127
7.3 訓練數據歸一化127
7.4 用近鄰方法實現推薦129
7.5 用回歸方法實現推薦132
7.6 結合多種方法133
7.7 購物籃分析135
7.7.1 獲得有用的預測結果136
7.7.2 分析超市購物籃137
7.8 關聯規則挖掘140
7.9 小結141
第8章 人工神經網路與深度學習143
8.1 使用TensorFlow143
8.1.1 TensorFlow API 144
8.1.2 圖144
8.1.3 會話145
8.1.4 有用的操作146
8.2 保存和還原神經網路147
8.2.1 訓練神經網路149
8.2.2 卷積神經網路149
8.2.3 循環神經網路156
8.3 LSTM用於文本預測157
8.4 LSTM用於圖像處理160
8.5 小結162
第9章 分類Ⅱ—情感分析163
9.1 本章概覽163
9.2 獲取Twitter數據163
9.3 介紹樸素貝葉斯分類器164
9.3.1 了解貝葉斯定理 164
9.3.2 簡單化165
9.3.3 使用樸素貝葉斯進行分類166
9.3.4 對未曾出現的和奇怪的單詞進行說明168
9.3.5 對算術下溢進行說明169
9.4 創建並最佳化個分類器171
9.4.1 首先解決容易的問題171
9.4.2 使用所有類173
9.4.3 調整分類器參數175
9.5 清理tweet179
9.6 考慮單詞的類型180
9.6.1 確定單詞類型181
9.6.2 使用SentiWordNet成功作弊182
9.6.3 我們的個評估器184
9.6.4 把所有東西放在一起186
9.7 小結187
第10章 主題建模188
10.1 隱含狄利克雷分配188
10.1.1 構建主題模型189
10.1.2 按主題比較文檔 193
10.1.3 為整體維基百科建模195
10.1.4 選擇主題數量197
10.2 小結198
第11章 分類III—音樂流派分類199
11.1 本章概覽199
11.2 獲取音樂數據199
11.3 觀察音樂數據201
11.4 使用FFT構建個分類器204
11.4.1 增加實驗靈活性204
11.4.2 訓練分類器205
11.4.3 用混淆矩陣測試多類別問題的準確率207
11.4.4 另一種用接收者- 操作者特徵測量分類性能的方法209
11.5 使用梅爾頻率倒譜係數改善分類器性能212
11.6 用TensorFlow分類音樂215
11.7 小結220
第12章 計算機視覺222
12.1 圖像處理簡介222
12.1.1 載入和顯示圖像 223

相關詞條

熱門詞條

聯絡我們