數據挖掘原理與套用(2020年機械工業出版社出版的圖書)

數據挖掘原理與套用(2020年機械工業出版社出版的圖書)

本詞條是多義詞,共2個義項
更多義項 ▼ 收起列表 ▲

《數據挖掘原理與套用》是2020年4月機械工業出版社出版的圖書,作者是葛東旭。本書系統地介紹了數據挖掘原理、算法和套用的相關知識,內容覆蓋數據挖掘的整個過程:數據採集、數據預處理、數據分類分析、數據聚類分析、數據關聯分析和數據挖掘系統的套用等。

基本介紹

  • 書名:數據挖掘原理與套用
  • 作者:葛東旭
  • 出版社:機械工業出版社
  • ISBN:9787111646396 
內容簡介,圖書目錄,

內容簡介

本書以數據挖掘項目的典型開發過程為線索,對數據挖掘的生命周期中的各個環節,以及其中所涉及的概念、方法、技術和過程模型進行了全面細緻的介紹。對於數據挖掘核心部分的典型基礎算法,通過細緻的闡述、詳盡的示例和充分的討論,深入地展示了數據挖掘算法的內涵,以便讀者認知、學習和掌握。本書系統地介紹了數據挖掘原理、算法和套用的相關知識,內容覆蓋數據挖掘的整個過程:數據採集、數據預處理、數據分類分析、數據聚類分析、數據關聯分析和數據挖掘系統的套用等。在內容安排上通過數據挖掘的典型套用方法,將理論知識和工程技術套用有機地結合,淺顯易懂且實踐性強。本書可以作為高等院校計算機科學與技術、信息管理、數據分析等專業的教科書,也可作為企業管理、信息分析人員的技術參考書籍。本書配有電子課件,及與書中例題、作業題配套的數據素材,歡迎選用本書作教材的老師發郵件到[email protected]索取,或登錄www.cmpedu.com註冊下載。

圖書目錄

目 錄
前 言
第1章 緒論1
1.1 信息爆炸與大數據1
1.2 什麼是數據挖掘5
1.3 數據挖掘的任務6
1.4 數據挖掘的套用7
1.5 數據挖掘系統結構9
1.6 數據挖掘面臨的挑戰9
1.7 數據挖掘樣例數據和相關資料10
思考與練習13
參考文獻13
第2章 數據挖掘的過程14
2.1 數據分析能力14
2.2 數據挖掘的過程16
2.3 三階段過程模型17
2.4 SEMMA方法19
2.5 CRISP-DM過程模型21
2.6 5A模型25
2.7 模型融合26
本章小結26
思考與練習27
參考文獻27
第3章 數據準備28
3.1 數據收集28
3.2 數據抽樣29
3.3 數據集成32
3.4 數據清理39
3.5 數據歸約43
3.6 數據變換48
本章小結50
思考與練習51
參考文獻51
第4章 數據探索52
4.1 數據探索的作用52
4.2 數據可視化54
4.3 數據統計分析70
4.4 載入Excel外掛程式78
本章小結79
思考與練習79
參考文獻79
第5章 關聯分析81
5.1 關聯分析原理81
5.2 由候選項集產生頻繁項集84
5.3 計算支持度計數94
5.4 FP-Growth算法98
5.5 產生頻繁項集算法複雜度105
5.6 生成規則106
5.7 關聯規則的評估111
本章小結116
思考與練習116
參考文獻118
第6章 分類預測119
6.1 分類的原理119
6.2 決策樹分類122
6.3 基於規則的分類器151
6.4 貝葉斯分類器156
6.5 人工神經網路173
6.6 支持向量機186
6.7 模型評估192
本章小結197
思考與練習197
參考文獻198
第7章 聚類分析199
7.1 聚類的基本概念200
7.2 K均值(K-means)聚類方法208
7.3 K中心點(K-medoids)算法215
7.4 層次聚類216
7.5 DBSCAN聚類222
7.6 聚類算法評估228
本章小結232
思考與練習232
參考文獻233
第8章 回歸分析234
8.1 回歸分析的概念234
8.2 回歸算法235
8.3 回歸的評估與檢驗244
本章小結249
思考與練習249
參考文獻251
第9章 數據挖掘的工具252
9.1 MATLAB252
9.2 SPSS Modeler253
9.3 SAS Enterprise Miner254
9.4 WEKA255
9.5 R256
本章小結256
參考文獻257
第10章 WEKA數據挖掘套用258
10.1 WEKA簡介258
10.2 Explorer261
10.3 Experimenter302
10.4 KnowledgeFlow304
10.5 WEKA API310
10.6 WEKA的設定和使用311
本章小結313
思考與練習313
參考文獻313

相關詞條

熱門詞條

聯絡我們