機器學習入門——基於Sklearn

《機器學習入門——基於Sklearn》是清華大學出版社於2022年出版的書籍,作者是周元哲。

基本介紹

  • 書名:機器學習入門——基於Sklearn
  • 作者:周元哲
  • 出版社:清華大學出版社
  • 出版時間:2022年2月1日
  • 定價:49.90 元
  • ISBN:9787302599982
內容簡介,圖書目錄,

內容簡介

本書以Python為基礎,使用Sklearn平台,逐步帶領讀者熟悉並掌握機器學習的經典算法。全書共12章,主要內容包括人工智慧概述、Python科學計算、數據清洗與特徵預處理、數據劃分與特徵提取、特徵降維與特徵選擇、模型評估與選擇、KNN算法、決策樹、線性模型、樸素貝葉斯算法、支持向量機和k均值聚類算法,附錄介紹了課程教學大綱和Sklearn數據集。 本書內容精練,文字簡潔,結構合理,案例經典且實用,綜合性強,面向機器學習入門讀者,側重提高。 本書適合作為高等院校相關專業機器學習入門課程教材或教學參考書,也可以供從事機器學習套用開發的技術人員參考。

圖書目錄

目錄
第1章人工智慧概述1
1.1相關概念1
1.1.1人工智慧1
1.1.2機器學習2
1.1.3深度學習2
1.1.4三者關係2
1.2機器學習三要素3
1.2.1數據3
1.2.2算法4
1.2.3模型6
1.3機器學習開發流程6
1.3.1數據採集6
1.3.2數據預處理7
1.3.3特徵工程7
1.3.4模型構建和訓練7
1.3.5模型最佳化和評估8
1.4Sklearn框架8
1.4.1Sklearn簡介9
1.4.2Sklearn的安裝過程10
1.4.3基於Sklearn的機器學習流程10
1.5Anaconda13
1.5.1Anaconda簡介13
1.5.2Anaconda的安裝過程13
1.5.3Anaconda的運行方式15
1.5.4Jupyter Notebook17
1.6學習建議與方法20
1.6.1學習建議20
1.6.2學習方法21
1.6.3Kaggle競賽平台21第2章Python科學計算22
2.1走進科學計算22
2.2NumPy23
2.2.1NumPy簡介23
2.2.2創建數組25
2.2.3查看數組26
2.2.4索引和切片27
2.2.5矩陣運算28
2.2.6主要方法29
2.3Matplotlib30
2.3.1Matplotlib簡介30
2.3.2圖表要素31
2.3.3線圖31
2.3.4散點圖32
2.3.5餅狀圖33
2.3.6條形圖34
2.3.7直方圖34
2.4SciPy35
2.4.1SciPy簡介35
2.4.2稀疏矩陣36
2.4.3泊松分布37
2.4.4二項分布37
2.4.5常態分配38
2.4.6均勻分布39
2.4.7指數分布40
2.5Pandas41
2.5.1Pandas簡介41
2.5.2Series42
2.5.3DataFrame46
2.5.4Index52
2.5.5plot53第3章數據清洗與特徵預處理56
3.1數據清洗56
3.1.1數據清洗簡介56
3.1.2評價標準56
3.2清洗方法56
3.2.1缺失值56
3.2.2異常值58
3.2.3重複值60
3.2.4Pandas數據清洗函式60
3.3特徵預處理67
3.3.1歸一化68
3.3.2標準化69
3.3.3魯棒化70
3.3.4正則化70
3.3.5學生數據清洗示例71
3.4missingno76
3.4.1missingno簡介76
3.4.2圖示功能76
3.4.3數據可視化示例79
3.5wordcloud80
3.5.1wordcloud簡介80
3.5.2wordcloud示例80第4章數據劃分與特徵提取83
4.1數據劃分83
4.1.1留出法83
4.1.2交叉驗證法84
4.1.3自助法87
4.2獨熱編碼88
4.2.1獨熱編碼簡介88
4.2.2獨熱編碼示例88
4.3初識特徵提取90
4.4字典特徵提取91
4.4.1字典特徵提取簡介91
4.4.2DictVectorizer91
4.5文本特徵提取92
4.5.1CountVectorizer93
4.5.2TfidfVectorizer94
4.6中文分詞95
4.6.1簡介95
4.6.2jieba分詞庫96
4.6.3停用詞表103第5章特徵降維與特徵選擇107
5.1初識特徵降維107
5.2線性判別分析107
5.2.1線性判別分析簡介107
5.2.2線性判別分析示例108
5.3主成分分析109
5.3.1主成分分析簡介109
5.3.2components參數110
5.4特徵選擇112
5.4.1簡介112
5.4.23種方法112
5.5包裝法113
5.5.1遞歸特徵消除113
5.5.2交叉驗證遞歸特性消除114
5.6過濾法116
5.6.1移除低方差特徵116
5.6.2單變數特徵選擇117
5.7皮爾森相關係數118
5.7.1皮爾森相關係數簡介118
5.7.2皮爾森相關係數套用示例119
5.8嵌入法121
5.8.1基於懲罰項的特徵選擇121
5.8.2基於樹模型的特徵選擇121第6章模型評估與選擇123
6.1欠擬合和過擬合123
6.1.1欠擬合123
6.1.2過擬合124
6.1.3正則化124
6.2模型調參125
6.2.1格線搜尋125
6.2.2隨機搜尋126
6.3分類評價指標127
6.3.1混淆矩陣127
6.3.2準確率129
6.3.3精確率130
6.3.4召回率131
6.3.5F1分數132
6.3.6ROC曲線133
6.3.7AUC134
6.3.8分類評估報告135
6.4損失函式136
6.5回歸損失136
6.5.1MAE136
6.5.2MSE137
6.5.3RMSE138
6.5.4R2分數138
6.5.5Huber損失139
6.6分類損失141
6.6.1平方損失函式141
6.6.2絕對誤差損失函式141
6.6.301損失函式141
6.6.4對數損失函式142
6.6.5鉸鏈損失函式143

相關詞條

熱門詞條

聯絡我們