作者簡介
劉偉江,經濟學博士,吉林大學商學院副教授、碩士生導師
目錄信息
前 言……………………………………………………………………………………………1
第1章 概述 ……………………………………………………………………………………1
1.1 商務智慧型簡介 ………………………………………………………………………1
1.1.1 商務智慧型概念 ………………………………………………………………1
1.1.2 商務智慧型的發展 ……………………………………………………………3
1.1.3 從數據處理的角度看商務智慧型的組成 ……………………………………6
1.2 為什麼需要商務智慧型 ………………………………………………………………7
1.3 商務智慧型工具 ………………………………………………………………………8
第2章 數據倉庫 ………………………………………………………………………………12
2.1 數據倉庫概述 ………………………………………………………………………12
2.1.1 數據倉庫的概念及特點 ……………………………………………………12
2.1.2 資料庫與數據倉庫的區別 …………………………………………………14
2.1.3 數據倉庫的技術支持 ………………………………………………………16
2.2 數據倉庫的設計 ……………………………………………………………………16
2.3 數據倉庫的構建實例——以Foodmart 2000.mdb數據集為例 …………………24
第3章 數據預處理 ……………………………………………………………………………38
3.1 為什麼需要預處理數據 ……………………………………………………………38
3.2 數據清理 ……………………………………………………………………………40
3.2.1 空缺值處理 …………………………………………………………………40
3.2.2 異常值檢測 …………………………………………………………………41
3.2.3 重複記錄檢測 ………………………………………………………………42
3.3 數據集成 ……………………………………………………………………………43
3.4 數據變換 ……………………………………………………………………………44
3.5 數據歸約 ……………………………………………………………………………47
第4章 在線上分析處理 …………………………………………………………………………50
4.1 OLAP的概念與特點 …………………………………………………………………50
4.1.1 OLAP的概念 …………………………………………………………………50
4.1.2 OLAP的特點 …………………………………………………………………51
4.1.3 OLTP和OLAP的對比 …………………………………………………………52
4.2 OLAP的一些基本概念 ………………………………………………………………53
4.3 OLAP的分類 …………………………………………………………………………55
4.4 OLAP的基本操 作……………………………………………………………………57
4.5 OLAP——以Foodmart 2000.mdb數據集中庫存數據表等相關數據為例 ………61
第5章 分類 ……………………………………………………………………………………68
5.1 分類的概念 …………………………………………………………………………68
5.2 決策樹分類 …………………………………………………………………………69
5.2.1 基本概念 ……………………………………………………………………69
5.2.2 決策樹的生成過程 …………………………………………………………69
5.2.3 決策樹停止的條件 …………………………………………………………74
5.2.4 決策樹的修剪 ………………………………………………………………77
5.2.5 決策樹的評估 ………………………………………………………………80
5.3 貝葉斯分類 …………………………………………………………………………83
5.4 人工神經網路分類 …………………………………………………………………85
5.4.1 人工神經網路概述 …………………………………………………………85
5.4.2 神經元的數學模型 …………………………………………………………86
5.4.3 人工神經網路模型 …………………………………………………………87
5.4.4 神經網路拓撲結構的確定 …………………………………………………89
5.5 分類過程中面臨的問題——不均衡數據集 ………………………………………90
5.6 其他分類方法 ………………………………………………………………………91
5.6.1 k-最近鄰居法 ………………………………………………………………92
5.6.2 粗糙集分類法 ………………………………………………………………94
5.7 Microsoft分類挖掘模型的操作過程——以基於決策樹的客戶分類為例 ………97
第6章 關聯規則 ………………………………………………………………………………111
6.1 關聯規則簡介 ………………………………………………………………………112
6.2 關聯規則的分類 ……………………………………………………………………113
6.3 由事務資料庫挖掘單維關聯規則 …………………………………………………115
6.3.1 Aprior算法 …………………………………………………………………115
6.3.2 頻繁模式增長 ………………………………………………………………118
6.4 關聯規則的推廣 ……………………………………………………………………122
6.4.1 多層關聯規則 ………………………………………………………………122
6.4.2 多維關聯規則 ………………………………………………………………124
6.5 時序關聯規則 ………………………………………………………………………125
6.6 商品關聯關係分析——以Foodmart 2000.mdb數據集中1997年銷售數據為例 ………………………………………………………128
第7章 聚類 ……………………………………………………………………………………144
7.1 簡介 …………………………………………………………………………………144
7.2 聚類分析算法 ………………………………………………………………………146
7.2.1 K-均值簇算法 ………………………………………………………………146
7.2.2 EM算法 ………………………………………………………………………148
7.3 聚類分析的套用 ……………………………………………………………………152
7.4 聚類分析的操作過程——基於客戶價值的聚類分析 ……………………………153
第8章 商務智慧型在管理中的套用 ……………………………………………………………163
8.1 基於決策樹的職員職位影響因素研究 ……………………………………………163
8.2 基於聚類方法的廣告效應差異分析 ………………………………………………172
8.3 基於貝葉斯方法和決策樹方法的顧客分類效果比較研究 ………………………179
8.4 基於聚類方法的顧客特徵分析 ……………………………………………………186