《數據倉庫與數據挖掘工程實例》是2014年清華大學出版社出版的圖書。
基本介紹
- 書名:數據倉庫與數據挖掘工程實例
- ISBN:9787302355410
- 定價:23.00
- 出版社:清華大學出版社
- 出版時間:2014年8月27日
- 裝幀:平裝
圖書簡介,目錄,
圖書簡介
數據倉庫與數據挖掘是與計算機、信息類等相關專業的核心課程。本書採用提出問題、分析問題、解決問題的思路,通過工程實例介紹了SQL Server 2005和Weka軟體的使用方法以及在線上分析處理技術、關聯規則方法、決策樹方法、貝葉斯方法、人工神經網路方法、聚類分析方法、線性回歸方法等數據倉庫與數據挖掘技術。
目錄
實例1基於在線上分析處理技術的稅務審計分析1
1.1任務描述1
1.2技術原理1
1.2.1在線上分析處理的定義1
1.2.2在線上分析處理的一些具體操作1
1.3具體實現4
1.3.1建立資料庫4
1.3.2新建數據源10
1.3.3新建數據源視圖15
1.3.4瀏覽數據17
1.3.5數據分析20
1.4案例總結23實例2基於關聯規則方法的網上交易服務質量評價分析24
2.1任務描述24
2.2技術原理25
2.2.1關聯規則的概念25
2.2.2Apriori算法25
2.3具體實現26
2.4案例小結32實例3基於WekaKnowledgFlow模組的大學生專業方向預測分析33
3.1任務描述33
3.2技術原理33
3.2.1數據收集和準備33
3.2.2模型選擇33
3.3具體實現33
3.3.1數據預處理33
3.3.2建立和使用知識流35
3.4案例小結39實例4基於決策樹方法的網球運動天氣狀況評價分析41
4.1任務描述41
4.2技術原理41
4.2.1決策樹的概念41
4.2.2資訊理論的基本概念42
4.2.3ID3建樹算法42
4.3具體實現42
4.4案例小結48實例5基於WekaExperimenter模組的人力資源管理挖掘模型選擇分析49
5.1任務描述49
5.2技術原理49
5.2.1挖掘類型確定49
5.2.2數據收集和準備49
5.3具體實現50
5.3.1數據預處理50
5.3.2模型比較和選擇51
5.4案例小結55實例6基於貝葉斯方法的證券客戶流失預警分析5...
6.1任務描述56
6.2技術原理57
6.2.1樸素貝葉斯分類算法57
6.2.2樸素貝葉斯分類舉例58
6.3具體實現59
6.4案例小結63實例7基於人工神經網路方法的信貸數據分析64
7.1任務描述64
7.2技術原理64
7.2.1BP神經網路結構64
7.2.2BP神經網路學習算法65
7.3具體實現67
7.3.1數據準備67
7.3.2挖掘流程70
7.4案例小結78實例8基於Kmeans方法的梔子花聚類分析79
8.1任務描述79
8.2技術原理79
8.3具體實現80
8.4案例小結87實例9基於線性回歸方法的汽車油耗預測分析88
9.1任務描述88
9.2技術原理88
9.3具體實現89
9.4案例小結95實例10基於決策樹方法的中文文本自動分類分析96
10.1任務描述96
10.2技術原理96
10.2.1文本挖掘的概念96
10.2.2文本分詞技術96
10.2.3文本特徵表示97
10.3具體實現97
10.4案例小結105附錄ASQLServer2005的安裝106
A1任務描述106
A2具體實現106附錄BWeka軟體的安裝和數據轉換114
B1任務描述114
B2具體實現114參考文獻128第1部分基礎
第1章EOS概述3