Python數據處理與挖掘

Python數據處理與挖掘

《Python數據處理與挖掘》是2015年機械工業出版社出版的圖書,作者是張良均、王路、譚立雲、蘇劍林。

基本介紹

  • 書名:Python數據處理與挖掘
  • 作者:張良均
    王路
    譚立雲
    蘇劍林
  • 出版社:機械工業出版社
  • ISBN:9787111521235
內容簡介,圖書目錄,作者簡介,

內容簡介

10餘位數戒判籃據挖掘領域資深專家鞏嫌拔只和科研人員,10餘年大數據挖掘諮詢與實施經驗結晶。從數據挖掘的套用出發,以電力、航空、醫療、網際網路、生產製造以及公共服務等行業真實案例為主線,深入淺出介紹Python數據挖掘建模過程,實踐性極強。
  本書共15章,分兩戒轎雅個部分:基礎篇、實戰篇。基礎篇介紹了數據挖掘的基本原理,實戰篇介紹了一個個真實案例,通過對案例深入淺出的剖析,使讀者在不知不覺中通過案例實踐獲得數據挖掘項目經驗,同時快速領悟看似難懂的數據挖掘理論。讀者在閱讀過程中,應充分利用隨書配套的案例建模數據,藉助相關的數據挖掘建模工具,通過上機實驗,以快速理解相關知識與理論。
  基礎篇(第1~5章),第1章的主要內容是數據挖掘概述;第2章對本書所用到的數據挖掘建模工具Python語言進行了簡明扼要的說明;第3章、第4章、第5章對數據挖掘的建模過程,包括數據探索、數據預處理及挖掘建模的常用算法與原理進行了介紹。
  實戰篇(第6~15章),重點對數據挖掘技術在電力、航空、醫療、網際網路、生產製造以及公共服務等行業的套用進行了分析。在案例結構組織上,本書是按照先介紹案例背景與挖掘目標,再闡述分析方法與過程,最後完成模型構建的順序進行的,在建模過程的關鍵環節,穿插程式實現代碼。最後通過上機實踐,加深讀者對數據挖掘技術在案例套用中的理解。

圖書目錄

前言
基礎篇
第1章數據挖掘基礎
1.1某知名連鎖餐飲企業的困惑
1.2從餐飲服務到數據挖掘
1.3數據挖掘的基本任務
1.4數據挖掘建模過程
1.4.1定義挖掘目標
1.4.2數據取樣
1.4.3數據探索
1.4.4數據預處理
1.4.5挖掘建模
1.4.6模型評價
1.5常用的數據挖掘建模工具
1.6小結
每2章Python數據分析簡介
2.1搭建Python開發平台
2.1.1所要考慮的問題
2.1.2基礎平台的搭建
2.2 Python使用入門
2.2.1運行方式
2.2.2基本命令
2.2.3數據結構
2.2.4庫的導入與添加
2.3 Python數據分析工全催具
2.3.1 Numpy
2.3.2 Scipy
2.3.3 Matplotlib
2.3.4 Pandas
2.3.5 StatsModels'''''
2.3.6 Scikit-Leam'''''
2.3.7 Keras
2.3.8 Gensim
2.4配套資源使用設定
2.5小結
第3章數據探索
3.1數據質量分析
3.1.1缺失值分析
3.1.2異記道章常值分析
3.1.3 -致性分析
3.2數據特徵分析
3.2.1分布分析
3.2.2對比分析
3.2.3統計量分析
?3.3Python主再檔頁碑要數據探索函式
3.3.1基本統計特徵函式
3.3.2拓展統計特徵函式
3.3.3統計作圖函式
3.4小結
數據預處理
4.1數據清洗
4.1.1缺失值處理
4.1.2異常值處理
4.2數據集成
4.2.1實體識別
4.2.2冗餘屬性識別
413數據變換
4.3.1簡單函式變換
4.3.2規範化
4.3.3連續屬性離散化
4.3.4屬性構造
4.3.5小波變換
4.4數據規約
4.4.1屬性規約
4.4.2數值規約
4.5 Python主要數據預處理函式
4.6小結
第5章挖掘建模
5.1分類與預測
5.1.1實現過程
5.1.2常用的分類與預測算法
5.1.3回歸分析
5.1.4決策樹
5.1.5人工神經網路
5.1.6分類與預測算法評價
5.1.7 Python分類預測模型特點 -
5.2聚類分析
5.2.1 常用聚類分析算法
5.2.2 K-Means聚類算法
5.2.3聚類分析算法評價
5.2.4 Python主要聚類分析算法
5.3關聯規則
5.3.1 常用關聯規則算法
5.3.2 Apriori算法
5.4時序模式
5.4.1時間序列算法
5.4.2時間序列的預處理
5.4.3平穩時間序列分析
5.4.4非平穩時間序列分析
5.4.5 Python主要時序模式算法
5.5離群點檢測 134
5.5.1離群點檢測方法
5.5.2基於模型的離狼體兵群點檢測方法
5.5.3基於聚類的離群點檢測方法
5.6小結
實戰篇
第6章電力竊漏電用戶自動識別
6.1背景與挖掘目標
6.2分析方法與過程
6.2.1數據抽取
6.2.2數據探索分析
6.2.3數據預處理
6.2.4構建專家樣本
6.3上機實驗
6.4拓展思考
6.5小結
第7章航空公司客戶價值分析
7.1背景與挖掘目標
7.2分析方法與過程
7.2.1數據抽取
7.2.2數據探索分析
7.2.3數據預處理
7.2.4模型構建
7.3上機實驗
7.4拓展思考 一
7.5小結
第8章中醫證型關聯規則挖掘
8.1背景與挖掘目標
8.2分析方法與過程
8.2.1數據獲取
8.2.2數據預處理
8.2.3模型構建
8.3上機實驗
8.4拓展思考
8.5小結
第9章基於水色圖像的水質評價
9.1背景與挖掘目標
9.2分析方法與過程
9.2.1數據預處理
9.2.2模型構建
9.2.3水質評價
9.3上機實驗
9.4拓展思考
9.5小結
第10章家用電器用戶行為分析與
事件識別
10.1背景與挖掘目標
10.2分析方法與過程
10.2.1數據抽取
10.2.2數據探索分析
10.2.3數據預處理
10.2.4模型構建
10.2.5模型檢驗
10.3上機實驗
10.4拓展思考
10.5小結
第11章套用系統負載分析與磁碟
容量預測
11.1背景與挖掘目標
11.2分析方法與過程
11.2.1數據抽取
11.2.2數據探索分析
11.2.3數據預處理
11.2.4模型構建
11.3上機實驗
11.4拓展思考
11.5小結
第12章電子商務網站用戶行為分析
及服務推薦
12.1背景與挖掘目標
12.2分析方法與過程
12.2.1數據抽取
12.2.2數據探索分析
12.2.3數據預處理
12.2.4模型構建
12.3上機實驗
12.4拓展思考
12.5小結
第13章財政收入影響因素分析及
13.1預測模型
13.2背景與挖掘目標
分析方法與過程
13.2.1灰色預測與神經網路的組合
模型
13.2.2數據探索分析
13.2.3模型構建
13.3上機實驗
13.4拓展思考
13.5小結 一
第14章 基於基站定位數據的商圈
分析 一
14.1背景與挖掘目標
14.2分析方法與過程
14.2.1數據抽取
14.2.2數據探索分析
14.2.3數據預處理
14.2.4模型構建
14.3上機實驗
14.4拓展思考
14.5小結
第15章電商產品評論數據情感
分析
15.1背景與挖掘目標
15.2分析方法與過程
15.2.1評論數據採集
15.2.2評論預處理
15.2.3文本評論分詞
15.2.4模型構建
15.3.上機實驗
15.4拓展思考
15.5小結
參考文獻

作者簡介

張良均,資深大數據挖掘專家和模式識別專家,高級信息項目管理師,有10多年的大數據挖掘套用、諮詢和培訓經驗。為電信、電力、政府、網際網路、生產製造、零售、銀行、生物、化工、醫藥等多個行業上百家大型企業提供過數據挖掘套用與諮詢服務,實踐經驗非常豐富。此外,他精通Java EE企業級套用開發,是廣東工業大學、華南師範大學、華南農業大學、貴州師範學院、韓山師範學院、廣東技術師範學院兼職教授,著有《神經網路實用教程》、《數據挖掘:實用案例分析》、《MATLAB數據分析與挖掘實戰》《R語言數據分析與挖掘實戰》等暢銷書。
3.2數據特徵分析
3.2.1分布分析
3.2.2對比分析
3.2.3統計量分析
?3.3Python主要數據探索函式
3.3.1基本統計特徵函式
3.3.2拓展統計特徵函式
3.3.3統計作圖函式
3.4小結
數據預處理
4.1數據清洗
4.1.1缺失值處理
4.1.2異常值處理
4.2數據集成
4.2.1實體識別
4.2.2冗餘屬性識別
413數據變換
4.3.1簡單函式變換
4.3.2規範化
4.3.3連續屬性離散化
4.3.4屬性構造
4.3.5小波變換
4.4數據規約
4.4.1屬性規約
4.4.2數值規約
4.5 Python主要數據預處理函式
4.6小結
第5章挖掘建模
5.1分類與預測
5.1.1實現過程
5.1.2常用的分類與預測算法
5.1.3回歸分析
5.1.4決策樹
5.1.5人工神經網路
5.1.6分類與預測算法評價
5.1.7 Python分類預測模型特點 -
5.2聚類分析
5.2.1 常用聚類分析算法
5.2.2 K-Means聚類算法
5.2.3聚類分析算法評價
5.2.4 Python主要聚類分析算法
5.3關聯規則
5.3.1 常用關聯規則算法
5.3.2 Apriori算法
5.4時序模式
5.4.1時間序列算法
5.4.2時間序列的預處理
5.4.3平穩時間序列分析
5.4.4非平穩時間序列分析
5.4.5 Python主要時序模式算法
5.5離群點檢測 134
5.5.1離群點檢測方法
5.5.2基於模型的離群點檢測方法
5.5.3基於聚類的離群點檢測方法
5.6小結
實戰篇
第6章電力竊漏電用戶自動識別
6.1背景與挖掘目標
6.2分析方法與過程
6.2.1數據抽取
6.2.2數據探索分析
6.2.3數據預處理
6.2.4構建專家樣本
6.3上機實驗
6.4拓展思考
6.5小結
第7章航空公司客戶價值分析
7.1背景與挖掘目標
7.2分析方法與過程
7.2.1數據抽取
7.2.2數據探索分析
7.2.3數據預處理
7.2.4模型構建
7.3上機實驗
7.4拓展思考 一
7.5小結
第8章中醫證型關聯規則挖掘
8.1背景與挖掘目標
8.2分析方法與過程
8.2.1數據獲取
8.2.2數據預處理
8.2.3模型構建
8.3上機實驗
8.4拓展思考
8.5小結
第9章基於水色圖像的水質評價
9.1背景與挖掘目標
9.2分析方法與過程
9.2.1數據預處理
9.2.2模型構建
9.2.3水質評價
9.3上機實驗
9.4拓展思考
9.5小結
第10章家用電器用戶行為分析與
事件識別
10.1背景與挖掘目標
10.2分析方法與過程
10.2.1數據抽取
10.2.2數據探索分析
10.2.3數據預處理
10.2.4模型構建
10.2.5模型檢驗
10.3上機實驗
10.4拓展思考
10.5小結
第11章套用系統負載分析與磁碟
容量預測
11.1背景與挖掘目標
11.2分析方法與過程
11.2.1數據抽取
11.2.2數據探索分析
11.2.3數據預處理
11.2.4模型構建
11.3上機實驗
11.4拓展思考
11.5小結
第12章電子商務網站用戶行為分析
及服務推薦
12.1背景與挖掘目標
12.2分析方法與過程
12.2.1數據抽取
12.2.2數據探索分析
12.2.3數據預處理
12.2.4模型構建
12.3上機實驗
12.4拓展思考
12.5小結
第13章財政收入影響因素分析及
13.1預測模型
13.2背景與挖掘目標
分析方法與過程
13.2.1灰色預測與神經網路的組合
模型
13.2.2數據探索分析
13.2.3模型構建
13.3上機實驗
13.4拓展思考
13.5小結 一
第14章 基於基站定位數據的商圈
分析 一
14.1背景與挖掘目標
14.2分析方法與過程
14.2.1數據抽取
14.2.2數據探索分析
14.2.3數據預處理
14.2.4模型構建
14.3上機實驗
14.4拓展思考
14.5小結
第15章電商產品評論數據情感
分析
15.1背景與挖掘目標
15.2分析方法與過程
15.2.1評論數據採集
15.2.2評論預處理
15.2.3文本評論分詞
15.2.4模型構建
15.3.上機實驗
15.4拓展思考
15.5小結
參考文獻

作者簡介

張良均,資深大數據挖掘專家和模式識別專家,高級信息項目管理師,有10多年的大數據挖掘套用、諮詢和培訓經驗。為電信、電力、政府、網際網路、生產製造、零售、銀行、生物、化工、醫藥等多個行業上百家大型企業提供過數據挖掘套用與諮詢服務,實踐經驗非常豐富。此外,他精通Java EE企業級套用開發,是廣東工業大學、華南師範大學、華南農業大學、貴州師範學院、韓山師範學院、廣東技術師範學院兼職教授,著有《神經網路實用教程》、《數據挖掘:實用案例分析》、《MATLAB數據分析與挖掘實戰》《R語言數據分析與挖掘實戰》等暢銷書。

相關詞條

熱門詞條

聯絡我們