python與數據挖掘

python與數據挖掘

《python與數據挖掘》是2016年機械工業出版社出版的圖書,作者是張良均、楊海宏、何子健、楊征。

基本介紹

  • 中文名:python與數據挖掘
  • 作者:張良均、楊海宏、何子健、楊征
  • 出版社:機械工業出版社
  • ISBN:9787111552611
內容簡介,圖書目錄,作者簡介,

內容簡介

這是一本適合教學和零基礎自學的Python與數據挖掘的教程,即便你完全沒有Python編程基礎和數據挖掘基礎,根據本書中的理論知識和上機實踐,你也能迅速掌握如何使用Python進行數據挖掘。本書已經被多所高校預定為教材,為了便於教學,書中還提供了大量的上機實驗和教學資源。
本書主要分為兩篇:
基礎篇(1~6章):第1章旨在讓讀者從全局把握數據挖掘、建模工具以及Python開發環境的搭建;第2章正式開始講解Python的基礎知識,包括操作符、變數類型、流程控制、數據結構等內容;第3、4章主要對Python面向對象的特性進行介紹,包括函式、類與對象等基本概念;第5章介紹主流的數據分析與挖掘的模組,以及其中具體的方法及對應的功能;第6章繼續拓展了模組的相關內容,介紹圖表繪製的專用模組(Matplotlib和Bokeh),深入淺出地展示如何方便地繪製點、線、圖等。
建模套用篇(7~11章):主要對數據挖掘中的常用算法進行介紹,強調在Python中對應函式的使用方法及其結果的解釋說明。內容涵蓋五大主流的數據挖掘算法,包括分類與預測、聚類分析建模、關聯規則分析、智慧型推薦和時間序列分析。按照從模型建立到模型評價的架構進行介紹,使讀者熟練掌握從建模到對模型評價的完整建模過程。

圖書目錄

前言
第一部分 基礎篇
第1章 數據挖掘概述 2
1.1 數據挖掘簡介 2
1.2 工具簡介 3
1.2.1 WEKA 3
1.2.2 RapidMiner 4
1.2.3 Python 5
1.2.4 R 5
1.3 Python開發環境的搭建 6
1.3.1 Python安裝 6
1.3.2 Python初識 11
1.3.3 與讀者的約定 14
1.4 小結 15
第2章 Python基礎入門 16
2.1 常用操作符 16
2.1.1 算術操作符 17
2.1.2 賦值操作符 17
2.1.3 比較操作符 18
2.1.4 邏輯操作符 18
2.1.5 操作符優先權 18
2.2 數字數據 19
2.2.1 變數與賦值 19
2.2.2 數字數據類型 20
2.3 流程控制 20
2.3.1 if語句 21
2.3.2 while循環 23
2.3.3 for循環 25
2.4 數據結構 27
2.4.1 列表 28
2.4.2 字元串 31
2.4.3 元組 35
2.4.4 字典 36
2.4.5 集合 39
2.5 檔案的讀寫 40
2.5.1 改變工作目錄 40
2.5.2 txt檔案讀取 41
2.5.3 csv檔案讀取 42
2.5.4 檔案輸出 43
2.5.5 使用JSON處理數據 43
2.6 上機實驗 44
第3章 函式 47
3.1 創建函式 48
3.2 函式參數 50
3.3 可變對象與不可變對象 52
3.4 作用域 53
3.5 上機實驗 55
第4章 面向對象編程 56
4.1 簡介 56
4.2 類與對象 58
4.3 __init__方法 59
4.4 對象的方法 61
4.5 繼承 65
4.6 上機實驗 68
第5章 Python實用模組 69
5.1 什麼是模組 69
5.2 NumPy 70
5.3 Pandas 75
5.4 SciPy 81
5.5 scikit-learn 84
5.6 其他Python常用模組 87
5.7 小結 88
5.8 上機實驗 88
第6章 圖表繪製入門 89
6.1 Matplotlib 89
6.2 Bokeh 94
6.3 其他優秀的繪圖模組 97
6.4 小結 97
6.5 上機實驗 97
第二部分 建模套用篇
第7章 分類與預測 100
7.1 回歸分析 100
7.1.1 線性回歸 101
7.1.2 邏輯回歸 104
7.2 決策樹 107
7.2.1 ID3算法 107
7.2.2 其他樹模型 111
7.3 人工神經網路 113
7.4 kNN算法 122
7.5 樸素貝葉斯分類算法 124
7.6 小結 127
7.7 上機實驗 127
第8章 聚類分析建模 129
8.1 K-Means聚類分析函式 129
8.2 系統聚類算法 133
8.3 DBSCAN聚類算法 138
8.4 上機實驗 142
第9章 關聯規則分析 144
9.1 Apriori關聯規則算法 145
9.2 Apriori在Python中的實現 146
9.3 小結 149
9.4 上機實驗 149
第10章 智慧型推薦 151
10.1 基於用戶的協同過濾算法 152
10.2 基於用戶的協同過濾算法在Python中的實現 154
10.3 小結 157
10.4 上機實驗 157
第11章 時間序列分析 159
11.1 ARIMA模型 159
11.2 小結 171
11.3 上機實驗 172
參考文獻 174

作者簡介

張良均
資深大數據挖掘專家,高級信息項目管理師,有近20年的大數據挖掘套用、諮詢和培訓經驗,被稱為“中國大數據挖掘培訓教父”。為電信、電力、政府、網際網路、生產製造、零售、銀行、生物、化工、醫藥等多個行業上百家大型企業提供過數據挖掘套用與諮詢服務,實踐經驗豐富。
現任廣東工業大學、華南師範大學、華南農業大學、貴州師範學院、韓山師範學院、廣東技術師範學院、廣西科技大學的兼職教授。著有《神經網路實用教程》《數據挖掘:實用案例分析》《MATLAB數據分析與挖掘實戰》《R語言數據分析與挖掘實戰》《Python數據分析與挖掘實戰》《Hadoop大數據分析與挖掘實戰》《R語言與數據挖掘》等暢銷圖書。

相關詞條

熱門詞條

聯絡我們