scikit-learn機器學習（第2版）

內容簡介

近年來，Python語言成為了廣受歡迎的程式語言，而它在機器學習領域也有很好的表現。scikit-learn是一個用Python語言編寫的機器學習算法庫，它可以實現一系列常用的機器學習算法，是一個好工具。

本書通過14章內容，詳細地介紹了一系列機器學習模型和scikit-learn的使用技巧。本書從機器學習的基礎理論講起，涵蓋了簡單線性回歸、K-近鄰算法、特徵提取、多元線性回歸、邏輯回歸、樸素貝葉斯、非線性分類、決策樹回歸、隨機森林、感知機、支持向量機、人工神經網路、K-均值算法、主成分分析等重要話題。

本書適合機器學習領域的工程師學習，也適合想要了解scikit-learn的數據科學家閱讀。通過閱讀本書，讀者將有效提升自己在機器學習模型的構建和評估方面的能力，並能夠高效地解決機器學習難題。

圖書目錄

第 1章　機器學習基礎　1

1.1　定義機器學習　1

1.2　從經驗中學習　2

1.3　機器學習任務　3

1.4　訓練數據、測試數據和驗證數據　4

1.5　偏差和方差　6

1.6　scikit-learn簡介　8

1.7　安裝scikit-learn　8

1.7.1　使用pip安裝　9

1.7.2　在Windows系統下安裝　9

1.7.3　在Ubuntu 16.04系統下安裝　10

1.7.4　在Mac OS系統下安裝　10

1.7.5　安裝Anaconda　10

1.7.6　驗證安裝　10

1.8　安裝pandas、Pillow、NLTK和matplotlib　11

1.9　小結　11

第 2章　簡單線性回歸　12

2.1　簡單線性回歸　12

2.1.1　用代價函式評價模型的擬合性　15

2.1.2　求解簡單線性回歸的OLS　17

2.2　評價模型　19

2.3　小結　21

第3章　用K-近鄰算法分類和回歸　22

3.1　K-近鄰模型　22

3.2　惰性學習和非參數模型　23

3.3　KNN模型分類　23

3.4　KNN模型回歸　31

3.5　小結　36

第4章　特徵提取　37

4.1　從類別變數中提取特徵　37

4.2　特徵標準化　38

4.3　從文本中提取特徵　39

4.3.1　詞袋模型　39

4.3.2　停用詞過濾　42

4.3.3　詞幹提取和詞形還原　43

scikit-learn機器學習（第2版）

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條