PYTHON3：數據分析與機器學習實戰

內容簡介

機器之所以能學習，來源於大量的數據分析。《Python 3 數據分析與機器學習實戰》首先講述數據分析的過程，然後詳細介紹常用的機器學習理論、算法與案例（大型案例 29 個），最終以解決實際問題驅動成書。

　　本書主要介紹的機器學套葛求膠習算法及數據分析方法，包括數據預處理、分類問題、預測問題、網路爬蟲、數據降維、數據壓縮、關聯分析、集成學習和深度學習等。全書分三大部分共 17章：第 0~3 章介紹 Python 的基礎知識、安裝和基本語法；第 4~7 章介紹 Python 的基本編程、機器學習基礎及 Python 中常用的第三方庫函式，並介紹數據預處理的基本方法；第 8~16 章分別介紹常用的機器學習分析算法及深度學習等。每章都採用多個經典案例圖文並茂地介紹機器學習的店霉原理和實現方法。

　　本書通熟易懂，並免費贈送全程同步教學錄像和 Python 3 編程基礎雙錄像，非常適合作為Python及機器學習和數據分析的入門與提高課程；對於不太熟悉Python、又想學習機器相關算法的初學者非常適合。

圖書目錄

第0章本書的技術體系

0.1 Python的發展趨勢

0.2 人工智慧時代學習Python的重要性

0.3 本書的技術體系

0.4 學習本書需要注意的事項

第1章 Python基礎知識

1.1 Python簡介

1.1.1 了解Python的起源與發展歷史

1.1.2 Python的特色

1.1.3 學習Python的原因

1.2 Python的當前版本

1.3 Python的優缺點

1.4 Python與其他語言的區別

1.5 Python的套用領域

第2章 Python的安裝、配置與卸您旋符載

2.1 Python的安裝

2.1.1 Python的下載埋埋謎

2.1.2 Python的安裝

2.2 Python的配置

2.2.1 Python環境變數的設定

2.2.2 Python的啟動

2.3 Python的卸載

第3章 Python 3 基礎語法

3.1 第一個Python程式

3.2 Python的輸入和輸出

3.2.1 Python的輸出語句

3.2.2 Python的輸入語句

3.3 Python的基本數據類型

3.3.1 數字

3.3.2 字元串

3.3.3 列表

3.3.4 元組

3.3.5 集合

3.3.6 字典

3.4 Python庫的導入

3.5 Python的集成開發環境

3.6 自測練習

第4章 Python 3的編程

4.1 條件語句

4.2 循環語句

4.2.1 while循環

4.2.2 for循環

4.3 函式

4.4 模組

4.5 自測練習

第5章機器學習基礎

5.1 機器學習概船船灶翻述

5.2 監督學習簡介

5.3 非監督學習簡介

5.4 增強學習簡介

5.5 深度學習簡介

5.6 機器學習常用術語

第6章 Python 機器學笑己擊習及分析工具

6.1 矩陣操作函式館（NumPy）

6.1.1 NumPy的安裝

6.1.2 NumPy的基本使用

6.2 科學計算的核心包（SciPy）

6.2.1 科學計算的核心包的安裝

6.2.2 科學計算的核心包的基本使用

6.3 Python 的繪圖庫（Matplotlib）

6.3.1 Matplotlib簡介及安裝

6.3.2 Matplotlib的基本使用

6.4 數據分析包（Pandas）

6.4.1 Pandas簡介和安裝

6.4.2 Pandas的基本使用方法

6.5 機器學習函式館（Scikit-learn）

6.6 統計建模工具包（StatsModels）

6.7 深度學習框架（TensorFlow）

第7章數據預處理

7.1 數據預處理概述

7.2 數據清理

7.2.1 異常數據處理

7.2.2 缺失值處理

7.2.3 噪聲數據處理

7.3 數據集成

7.4 數據變換

7.5 數據歸約

7.6 Python的主要數據預處理函式

7.6.1 Python的數據結構

7.6.2 數據缺失處理函式

第8章分類問題

8.1 分類概述

8.2 常用方法

8.2.1 k-近鄰算法

8.2.2 樸素貝榆判轎葉斯

8.2.3 支持向量機

8.2.4 AdaBoost算法

8.2.5 決策樹

8.2.6 Multi-layer Perceptron 多層感知機

8.3 項目實戰

8.3.1 實例1：使用k-近鄰算法實現約會網站的配對效果

8.3.2 實例2：使用樸素貝葉斯過濾垃圾郵件

8.3.3 實例3：SVM實現手寫識別系統

8.3.4 實例4：基於單層決策樹構建分類算法

8.3.5 實例5：使用決策樹對iris數據集分類

8.3.6 實例6：使用決策樹對身高體重數據進行分類

8.3.7 實例7：使用k-近鄰算法對鳶尾花數據進行交叉驗證

8.3.8 使用多層感知器分析，根據葡萄酒的各項化學特徵來

判斷葡萄酒的優劣

8.4 自測練習

第9章預測分析

9.1 預測概述

9.2 常用方法

9.2.1 時間序列分析預測法

9.2.2 BP神經網路模型

9.3 項目實戰

9.3.1 實例1：根據一年的歷史數據預測後十年的數據趨勢

9.3.2 實例2：使用神經網路預測公路運量

9.4 自測練習

第10章關聯分析

10.1 關聯分析概述

10.2 基本方法

10.2.1 Apriori算法

10.2.2 FP-Growth算法

10.3 項目實戰（解決目前流行的實際問題）

10.3.1 用Apriori進行關聯分析的實例

10.3.2 使用FP-Growth算法提取頻繁項集

10.4 自測練習

第11章網路爬蟲

11.1 網路爬蟲概述

11.1.1 網路爬蟲原理

11.1.2 爬蟲分類

11.2 網頁抓取策略和方法

11.2.1 網頁抓取策略

11.2.2 網頁抓取的方法

11.3 項目實戰

11.3.1 用Python抓取指定的網頁

11.3.2 用Python抓取包含關鍵字的網頁

11.3.3 下載貼吧中的圖片

11.3.4 股票數據抓取

11.4 自測練習

第12章集成學習

12.1 集成學習概述

12.2 常用方法

12.2.1 Bagging和隨機森林

12.2.2 Boosting和AdaBoost

12.3 項目實戰

12.3.1 使用隨機森林方法預測乘員的存活機率

12.3.2 使用AdaBoost方法進行二元分類

12.4 自測練習

第13章深度學習

13.1 深度學習概述

13.2 常用方法

13.2.1 監督學習的深度學習網路結構

13.2.2 非監督學習的深度學習網路結構

13.3 項目實戰

13.3.1 使用TensorFlow框架進行MNIST數據集生成

13.3.2 使用Theano框架進行MNIST數字識別

13.4 自測練習

第14章數據降維及壓縮

14.1 數據降維及壓縮概述

14.1.1 數據降維

14.1.2 圖像壓縮

14.2 基本方法

14.2.1 主成分分析

14.2.2 奇異值分解

14.3 項目實戰

14.3.1 主成分分析PCA實例

14.3.2 使用奇異值分解進行圖像壓縮

14.4 自測練習

第15章聚類分析

15.1 聚類分析概述

15.2 K-means算法

15.2.1 K-means算法與步驟

15.2.2 K-means算法涉及的問題

15.2.3 實際聚類問題的處理流程

15.3 項目實戰

15.3.1 K-means算法實現二維數據聚類

15.3.2 使用Scikit-learn中的方法進行聚類分析

15.4 自測練習

第16章回歸分析問題

16.1 回歸分析概述

16.2 基本方法

16.2.1 一元回歸分析

16.2.2 多元線性回歸

16.2.3 回歸的計算方法

16.2.4 邏輯回歸分析

16.3 項目實戰

16.3.1 身高與體重的回歸分析

16.3.2 房價預測

16.3.3 產品銷量與廣告的多元回歸分析

16.3.4 鳶尾花數據的邏輯回歸分析

16.4 自測練習

作者簡介

　龍馬高新教育成立於1998年，專注於計算機類圖書的策劃與編寫，其圖書曾多次獲得全國暢銷書獎。龍馬高新教育有著非常深厚的資源積累，與龍馬簽約的合作機構包括39所高校、8家協會、5家知名網站及近百名撰稿人。

PYTHON3：數據分析與機器學習實戰

基本介紹

內容簡介

圖書目錄

作者簡介

作者簡介

相關詞條

熱門詞條