Python機器學習實戰(2021年清華大學出版社出版的圖書)

本詞條是多義詞,共2個義項
更多義項 ▼ 收起列表 ▲

《Python機器學習實戰》是2021年清華大學出版社出版的圖書。

基本介紹

  • 中文名:Python機器學習實戰
  • 作者: 呂雲翔
  • 出版時間:2021年
  • 出版社:清華大學出版社
  • ISBN:9787302576419
內容簡介,圖書目錄,作者簡介,

內容簡介

本書以機器學習算法為主題,詳細介紹算法的理論細節與套用方法。全書共19章,分別介紹了邏輯回歸與z大熵模型、k-近鄰模型、決策樹模型、樸素貝葉斯模型、支持向量機模型、集成學習框架、EM算法、降維算法、聚類算法、神經網路模型等基礎模型或算法,以及8個綜合項目實例:汽車運動學片段分類、垃圾信息識別、乳腺癌識別、波士頓房價預測、生成動漫人物、鳶尾花分類、人臉識別、保險行為數據用戶分類器。本書重視理論與實踐相結合,希望為讀者提供全面而細緻的學習指導。
本書適合機器學習初學者、相關行業從業人員以及高等院校計算機科學、軟體工程等相關專業的師生閱讀。

圖書目錄

第1章機器學習概述
資源下載
1.1機器學習的組成
1.2分類問題及回歸問題
1.3監督學習、半監督學習和無監督學習
1.4生成模型及判別模型
1.5模型評估
1.5.1訓練誤差及泛化誤差
1.5.2過擬合及欠擬合
1.6正則化
1.7Scikitlearn模組
1.7.1數據集
1.7.2模型選擇
第2章邏輯回歸及最大熵模型
2.1線性回歸
2.1.1一元線性回歸
2.1.2多元線性回歸
2.2廣義線性回歸
2.2.1邏輯回歸
2.2.2多分類邏輯回歸
2.2.3交叉熵損失函式
2.3最大熵模型
2.3.1最大熵模型的導出
2.3.2最大熵模型與邏輯回歸之間的關係
2.4評價指標
2.4.1混淆矩陣
2.4.2準確率
2.4.3精確率與召回率
2.4.4PR曲線
2.4.5ROC曲線與AUC曲線
2.5實例: 基於邏輯回歸實現乳腺癌預測
第3章k近鄰算法
3.1k值的選取
3.2距離的度量
3.3快速檢索
3.4實例: 基於k近鄰算法實現鳶尾花分類
第4章決策樹
4.1特徵選擇
4.1.1信息增益
4.1.2信息增益比
4.2決策樹生成算法CART
4.3決策樹剪枝
4.3.1預剪枝
4.3.2後剪枝
4.4實例: 基於決策樹實現葡萄酒分類
第5章樸素貝葉斯分類器
5.1極大似然估計
5.2樸素貝葉斯分類
5.3拉普拉斯平滑
5.4樸素貝葉斯分類器的極大似然估計解釋
5.5實例: 基於樸素貝葉斯實現垃圾簡訊分類
第6章支持向量機
6.1最大間隔及超平面
6.2線性可分支持向量機
6.3線性支持向量機
6.4合頁損失函式
6.5核技巧
6.6二分類問題與多分類問題
6.6.1一對一
6.6.2一對多
6.6.3多對多
6.7實例: 基於支持向量機實現葡萄酒分類
第7章集成學習
7.1偏差與方差
7.2Bagging及隨機森林
7.2.1Bagging
7.2.2隨機森林
7.3Boosting及AdaBoost
7.3.1Boosting
7.3.2AdaBoost
7.4提升樹
7.4.1殘差提升樹
7.4.2GBDT
7.4.3XGBoost
7.5Stacking
7.6實例: 基於梯度下降樹實現波士頓房價預測
第8章EM算法及其套用
8.1Jensen不等式
8.2EM算法
8.3高斯混合模型GMM
8.4隱馬爾可夫模型
8.4.1計算觀測機率的輸出
8.4.2估計隱馬爾可夫模型的參數
8.4.3隱變數序列預測
8.5實例: 基於高斯混合模型實現鳶尾花分類
第9章降維
9.1主成分分析
9.1.1方差即協方差的無偏估計
9.1.2實例: 基於主成分分析實現鳶尾花數據降維
9.2奇異值分解
9.2.1奇異值分解的構造
9.2.2奇異值分解用於數據壓縮
9.2.3SVD與PCA的關係
9.2.4奇異值分解的幾何解釋
9.2.5實例: 基於奇異值分解實現圖片壓縮
第10章聚類
10.1距離度量
10.1.1閔可夫斯基距離
10.1.2餘弦相似度
10.1.3馬氏距離
10.1.4漢明距離
10.2層次聚類
10.3KMeans聚類
10.4KMedoids聚類
10.5DBSCAN
10.6實例: 基於KMeans實現鳶花聚類
第11章神經網路與深度學習
11.1神經元模型
11.2多層感知機
11.3損失函式
11.4反向傳播算法
11.4.1梯度下降法
11.4.2梯度消失及梯度爆炸
11.5卷積神經網路
11.5.1卷積
11.5.2池化
11.5.3網路架構
11.6循環神經網路
11.7生成對抗網路
11.8圖卷積神經網路
11.9深度學習發展
11.10實例: 基於卷積神經網路實現手寫數字識別
11.10.1MNIST數據集
11.10.2基於卷積神經網路的手寫數字識別
第12章實戰: 基於KMeans算法的汽車行駛運動學片段的分類
12.1樣本聚類
12.1.1SSE
12.1.2輪廓分析
12.2汽車行駛運動學片段的提取
12.3基於KMeans的汽車行駛運動學片段分類
第13章實戰: 從零實現樸素貝葉斯分類器用於垃圾信息識別
13.1算法流程
13.2數據集載入
13.3樸素貝葉斯模型
13.3.1構造函式設計
13.3.2數據預處理
13.3.3模型訓練
13.3.4測試集預測
13.3.5主函式實現
第14章實戰: 基於邏輯回歸算法進行乳腺癌的識別
14.1數據集載入
14.2Logistic模組
14.3模型評價
第15章實戰: 基於線性回歸、決策樹和SVM進行鳶尾花分類
15.1使用Logistic實現鳶尾花分類
15.2使用決策樹實現鳶尾花分類
15.3使用SVM實現鳶尾花分類
第16章實戰: 基於多層感知機模型和隨機森林模型的波士頓房價預測
16.1使用MLP實現波士頓房價預測
16.2使用隨機森林模型實現波士頓房價預測
第17章實戰: 基於生成式對抗網路生成動漫人物
17.1生成動漫人物任務概述
17.2反卷積網路
17.3DCGAN
17.4基於DCGAN的動漫人物生成
第18章實戰: 基於主成分分析法、隨機森林算法和SVM算法的人臉識別問題
18.1數據集介紹與分析
18.2LBP運算元
18.3提取圖片特徵
18.4基於隨機森林算法的人臉識別問題
18.5基於SVM算法的人臉識別問題
第19章實戰: 使用多種機器學習算法實現基於用戶行為數據的用戶分類器
19.1基於機器學習的分類器的技術概述
19.2工程數據的提取聚合和存儲
19.2.1數據整合的邏輯流程
19.2.2Sqoop數據同步
19.2.3基於Hive的數據倉庫
19.2.4基於Azkaban的數據倉庫的調度任務
19.2.5數據倉庫的數據集成和數據清洗
19.2.6整合後的數據表
19.3數據展示和分析
19.3.1數據集的選取和業務背景的描述
19.3.2各維度信息詳細說明
19.3.3各維度數據的描述性統計
19.3.4各維度數據的可視化
19.4特徵工程
19.4.1標準化
19.4.2區間縮放
19.4.3歸一化
19.4.4對定性特徵進行onehot編碼
19.4.5缺失值填補
19.4.6數據傾斜
19.5模型訓練和結果評價
19.5.1構造模型思路
19.5.2模型訓練的流程
19.5.3KFold交叉驗證
19.6各分類器模型的訓練和結果評價
19.6.1利用Python的sklearn包進行模型訓練的過程梳理
19.6.2邏輯斯諦分類模型的訓練和結果評價
19.6.3最小近鄰算法模型的訓練和結果評價
19.6.4線性判別分析模型的訓練和結果評價
19.6.5樸素貝葉斯算法的模型的訓練和結果評價
19.6.6決策樹模型的訓練和結果評價
19.6.7支持向量機模型的訓練和結果評價
19.7模型提升——集成分類器
19.7.1Boosting提升算法
19.7.2AdaBoost提升算法
19.7.3AdaBoost實現過程及實驗結果
附錄A用戶歷史充值情況數據表
附錄B用戶各類訂單餘額情況
附錄C各省用戶收到公示訊息後的充值情況
參考文獻

作者簡介

呂雲翔,1986-1992: 北方交通大學講師; 1992-1994: 比利時VUB大學套用信息技術碩士; 1994-1996: 比利時VUB大學MBA; 1996-2003: IT公司項目經理 2003-至今: 北航軟體學院副教授。已出版二十幾本教材(其中“計算機導論實踐教程”一書獲北航2010年教學成果三等獎);

相關詞條

熱門詞條

聯絡我們