機器學習——原理、算法與Python實戰(微課視頻版)

《機器學習——原理、算法與Python實戰(微課視頻版)》是2022年清華大學出版社出版的圖書,作者是姚捃、劉華春、侯向寧。

基本介紹

  • 中文名:機器學習——原理、算法與Python實戰(微課視頻版)
  • 作者:姚捃、劉華春、侯向寧
  • 出版社:清華大學出版社
  • 出版時間:2022年9月1日
  • 定價:59.90 元
  • ISBN:9787302616603
內容簡介,圖書目錄,

內容簡介

本書以Python為開發語言,採用理論與實踐相結合的形式,系統全面地介紹了機器學習涉及的核心知識。本書共6章,其中第1章介紹機器學習的基礎知識,包括機器學習的概念、分類、研究範圍、開發環境等,介紹第一個機器學習案例; 第2、3章介紹機器學習的主要方法: 監督學習與無監督學習,涉及目前機器學習最為流行的經典算法和模型,如KNN、樸素貝葉斯、決策樹、線性回歸、邏輯回歸、SVM、神經網路、PCA降維、KMeans,每個算法模型都配有代碼及可視化演示,讓讀者能更直觀形象地理解機器學習; 第4章介紹機器學習非常重要的數據處理方法: 特徵工程,特徵工程能進一步提高機器學習算法的性能; 第5章介紹機器學習模型的評估與最佳化,通過評估判斷模型優劣,評估後利用最佳化方法使其達到生產需求; 第6章介紹機器學習的套用案例,讓讀者更直觀地感受機器學習在生產生活中的實際用途。
本書附有配套教學課件、原始碼、習題,供讀者實踐,旨在通過邊學邊練的方式,鞏固所學知識,提升開發能力。
本書可作為高等學校計算機相關專業的教材,也可作為機器學習工程技術人員的參考用書。

圖書目錄

第1章機器學習基礎
1.1機器學習
1.1.1什麼是機器學習
1.1.2從數據中學習
1.1.3機器學習能夠解決的問題
1.2機器學習的分類
1.2.1學習方式
1.2.2算法的分類
1.3機器學習的範圍
1.4程式語言與開發環境
1.4.1選擇Python的原因
1.4.2安裝開發環境
1.4.3Scikitlearn
1.5第一個機器學習套用: 鳶尾花分類
1.5.1特徵數據與標籤數據
1.5.2訓練數據與測試數據
1.5.3構建機器學習模型
1.5.4預測與評估
1.6本章小結
習題
第2章監督學習
2.1監督學習概念與術語
2.1.1監督學習工作原理
2.1.2分類與回歸
2.1.3泛化
2.1.4欠擬合
2.1.5過擬合
2.1.6不收斂
2.2K近鄰算法
2.2.1K近鄰分類
2.2.2K近鄰回歸
2.3樸素貝葉斯
2.3.1貝葉斯定理
2.3.2樸素貝葉斯算法步驟
2.3.3在Scikitlearn中使用貝葉斯分類
2.4決策樹
2.4.1決策樹的基本思想
2.4.2決策樹學習算法
2.4.3構造決策樹
2.4.4決策樹的最佳化與可視化
2.4.5決策樹回歸
2.5線性模型
2.5.1線性回歸
2.5.2嶺回歸與Lasso回歸
2.5.3多項式回歸
2.5.4線性分類模型
2.6邏輯回歸
2.6.1邏輯回歸模型介紹
2.6.2邏輯回歸算法實現
2.7支持向量機
2.7.1支持向量
2.7.2線性SVM分類
2.7.3核技巧
2.7.4SVM回歸
2.7.5Scikitlearn SVM參數
2.8集成學習方法
2.8.1集成學習
2.8.2Bagging和Pasting
2.8.3隨機森林
2.8.4提升法
2.9人工神經網路
2.9.1從生物神經元到人工神經元
2.9.2感知器學習
2.9.3神經網路的訓練過程
2.9.4神經網路套用案例
2.10分類器的不確定度估計
2.10.1決策函式
2.10.2預測機率
2.11本章小結
習題
第3章無監督學習與數據預處理
3.1無監督學習
3.1.1無監督學習的類型
3.1.2無監督學習的挑戰
3.2數據預處理
3.2.1數據清洗
3.2.2數據變換
3.2.3數據集成
3.2.4數據規約
3.3降維
3.3.1數據壓縮
3.3.2數據可視化
3.3.3降維的主要方法
3.3.4PCA
3.3.5利用PCA實現半導體製造數據降維
3.4聚類
3.4.1KMeans聚類
3.4.2均值偏移聚類
3.4.3DBSCAN
3.4.4高斯混合模型的期望最大化(EM)聚類
3.4.5層次聚類
3.5本章小結
習題
第4章特徵工程
4.1特徵理解
4.2特徵增強
4.2.1EDA
4.2.2處理數據缺失
4.2.3標準化和歸一化
4.3特徵構建
4.3.1特徵構建的基礎操作
4.3.2特徵構建的數值變數擴展
4.3.3文本變數處理
4.4特徵選擇
4.4.1單變數特徵選擇
4.4.2模型特徵選擇
4.4.3疊代特徵選擇
4.5特徵轉換
4.5.1PCA
4.5.2LDA
4.6特徵學習
4.6.1數據的參數假設
4.6.2受限玻爾茲曼機(RBM)
4.6.3詞嵌入
4.7本章小結
習題
第5章模型評估與最佳化
5.1算法鏈與管道
5.1.1用管道方法簡化工作流
5.1.2通用的管道接口
5.2交叉驗證
5.2.1K折交叉驗證
5.2.2分層K折交叉驗證
5.3模型評價指標
5.3.1誤分類的不同影響
5.3.2混淆矩陣
5.3.3分類的不確定性
5.3.4準確率召回率曲線
5.3.5受試者工作特徵(ROC)與AUC
5.3.6多分類指標
5.3.7回歸指標
5.3.8在模型選擇中使用評估指標
5.4處理類的不平衡問題
5.4.1類別不平衡問題
5.4.2解決類別不平衡問題
5.5格線搜尋最佳化模型
5.5.1簡單格線搜尋選擇超參數
5.5.2驗證集用於選擇超參數
5.5.3帶交叉驗證的格線搜尋
5.6本章小結
習題
第6章機器學習套用案例
6.1電影推薦系統
6.1.1推薦系統基礎
6.1.2推薦引擎算法
6.1.3相似度指標
6.1.4電影推薦系統實戰
6.2情感分析系統
6.2.1情感分析概述
6.2.2導入數據集
6.2.3詞袋模型
6.2.4TFIDF
6.2.5數據預處理
6.2.6訓練模型
6.2.7模型評估及調優
6.3房價預測系統
6.3.1案例背景
6.3.2數據處理及可視化分析
6.3.3訓練模型
6.3.4模型評估
6.3.5模型調優
6.4人臉識別
6.4.1概述
6.4.2載入數據集
6.4.3訓練模型
6.4.4測試模型
6.4.5PCA主成分分析
6.4.6模型調優
6.5本章小結
習題

相關詞條

熱門詞條

聯絡我們