Python機器學習基礎教程

內容簡介

本書是機器學習入門書，以Python語言介紹。主要內容包括：機器學習的基本概念及其套用；實踐中常用的機器學習算法以及這些算法的優缺點；在機器學習中待處理數據的呈現方式的重要性，以及應重點關注數據的哪些方面；模型評估和調參的方法，重點講解交叉驗證和格線搜尋；管道的概念；如何將前面各章的方法套用到文本數據上，還介紹了一些文本特有的處理方法。

本書適合機器學習從業者或有志成為機器學習從業者的人閱讀。

圖書目錄

前言 ix

第 1 章　引言 1

1.1　為何選擇機器學習 1

1.1.1　機器學習能夠解決的問題 2

1.1.2　熟悉任務和數據 4

1.2　為何選擇Python 4

1.3　scikit-learn 4

1.4　必要的庫和工具 5

1.4.1　Jupyter Notebook 6

1.4.2　NumPy 6

1.4.3　SciPy 6

1.4.4　matplotlib 7

1.4.5　pandas 8

1.4.6　mglearn 9

1.5　Python 2 與Python 3 的對比 9

1.6　本書用到的版本 10

1.7　第一個套用：鳶尾花分類 11

1.7.1　初識數據 12

1.7.2　衡量模型是否成功：訓練數據與測試數據 14

1.7.3　要事第一：觀察數據 15

1.7.4　構建第一個模型：k 近鄰算法 16

1.7.5　做出預測 17

1.7.6　評估模型 18

1.8　小結與展望 19

第 2 章　監督學習 21

2.1　分類與回歸 21

2.2　泛化、過擬合與欠擬合 22

2.3　監督學習算法 24

2.3.1　一些樣本數據集 25

2.3.2　k 近鄰 28

2.3.3　線性模型 35

2.3.4　樸素貝葉斯分類器 53

2.3.5　決策樹 54

2.3.6　決策樹集成 64

2.3.7　核支持向量機 71

2.3.8　神經網路（深度學習） 80

2.4　分類器的不確定度估計 91

2.4.1　決策函式 91

2.4.2　預測機率 94

2.4.3　多分類問題的不確定度 96

2.5　小結與展望 98

第3 章　無監督學習與預處理 100

3.1　無監督學習的類型 100

3.2　無監督學習的挑戰 101

3.3　預處理與縮放 101

3.3.1　不同類型的預處理 102

3.3.2　套用數據變換 102

3.3.3　對訓練數據和測試數據進行相同的縮放 104

3.3.4　預處理對監督學習的作用 106

3.4　降維、特徵提取與流形學習 107

Python機器學習基礎教程

基本介紹

內容簡介

圖書目錄

熱門詞條