AI制勝：機器學習極簡入門

內容簡介

為了避免機器學習背後的複雜數學原理以及異常複雜的算法證明和推導嚇退一大批初學者，本書遵循“極簡入門”的理念，通過通俗易懂的語言，豐富的圖示和經典的案例，有效地降低了學習的門檻，讓廣大機器學習愛好者輕鬆入門機器學習。

本書共分11章，覆蓋的主要內容有機器學習概述、數據預處理、K最近鄰算法、回歸算法、決策樹、K-means聚類算法、隨機森林、樸素貝葉斯算法、支持向量機SVM、神經網路（卷積神經網路、Keras深度學習框架）和人臉識別入門等。從最簡單的常識來切入AI領域，打造無縫平滑的學習體驗。

本書的讀者不需要具有高等數學的深厚知識，也不需要有機器學習或者人工智慧（AI）的基礎，只需具備Python語言的基礎知識和簡單了解過NumPy、Pandas等科學基礎庫，就可以輕鬆閱讀並掌握。另外，高等院校和培訓機構也可以將此書作為機器學習入門教材使用。

第1章機器學習概述 1

1.1 什麼是機器學習 1

1.2 機器學習的流程 3

1.2.1 數據收集 3

1.2.2 數據預處理 3

1.2.3 特徵工程 4

1.2.4 模型構建和訓練 4

1.3 機器學習該如何學 5

1.3.1 AI時代首選Python 5

1.3.2 PyCharm可視化編輯器和Anaconda大禮包 7

1.3.3 掌握算法原理與掌握機器學習軟體庫同等重要 13

1.3.4 機器學習與深度學習的區別 13

1.4 機器學習分類 15

1.4.1 監督學習 15

1.4.2 無監督學習 16

1.4.3 強化學習 16

1.5 過擬合和欠擬合 17

1.5.1 過擬合 18

1.5.2 欠擬合 18

1.6 衡量機器學習模型的指標 19

1.6.1 正確率、精確率和召回率 19

1.6.2 F1 score和ROC曲線 21

第2章機器學習中的數據預處理 24

2.1 數據預處理的重要性和原則 24

2.2 數據預處理方法介紹 25

2.2.1 數據預處理案例——標準化、歸一化、二值化 25

2.2.2 數據預處理案例——缺失值補全、標籤化 26

2.2.3 數據預處理案例——獨熱編碼 28

2.2.4 通過數據預處理提高模型準確率 29

2.3 數據降維 31

2.3.1 什麼叫數據降維 31

2.3.2 PCA主成分分析原理 31

2.3.3 PCA主成分分析實戰案例 33

第3章 k最近鄰算法 36