《數據挖掘基礎與套用(sql server 2008)》一書首先系統地介紹了數據挖掘技術,然後虛擬一個“邦邦超市”,通過使用sql語言建立該超市的資料庫並對數據進行操作,再進一步利用sql server 2008的數據挖掘模型對超市積累的數據進行挖掘,以實際例子幫助讀者迅速理解並掌握數據挖掘技術,學會使用sql server 2008 提供的數據挖掘工具,提高零售企業的信息利用能力和經營水平。
基本介紹
- 書名:數據挖掘基礎與套用(SQL Server 2008)
- 作者:謝邦昌
- ISBN:9787111360735
- 出版時間:2011-11-8
基本信息,作者簡介,目錄,
基本信息
作者: 謝邦昌 [作譯者介紹] 叢書名: 商務智慧型與信息化技術叢書
出版社:機械工業出版社
ISBN:9787111360735
上架時間:2011-11-8
出版日期:2012 年1月
開本:16開
頁碼:1
版次:1-1
作者簡介
謝邦昌教授,台灣大學生物統計學博士、 現任台灣輔仁大學統計資訊學系教授、台灣輔仁大學管理學院商學所所長、中華資料採礦協會理事長、台北市政府市政顧問。他還擔任中華人民共和國國家統計局教材編審委員,廈門大學經濟學院計畫統計系講座教授、博士生導師,同時是中國人民大學統計學院、中央財經大學統計學院等國內許多著名高校的客座教授。
謝邦昌教授是台灣數據挖掘界的領軍人物及世界知名統計學家,長久以來致力推動兩岸商務智慧型、數據挖掘和統計套用研究的發展。目前的研究方向主要集中
目錄
《數據挖掘基礎與套用(sql server 2008)》
前言
第1章 數據挖掘與數據倉庫 1
1.1 數據挖掘簡介 1
1.1.1 數據挖掘的定義 1
1.1.2 數據挖掘的重要性 1
1.1.3 數據挖掘的功能 1
1.1.4 數據挖掘的步驟 2
1.1.5 數據挖掘建模的標準crisp-dm 2
1.2 商務智慧型簡介 4
1.2.1 商務智慧型 4
1.2.2 商務智慧型的定義 4
1.2.3 商務智慧型的架構 5
1.2.4 商務智慧型的實施流程 5
1.3 數據挖掘與其他相關領域的關係 6
1.3.1 數據挖掘與統計分析的不同 6
1.3.2 數據挖掘與數據倉庫的關係 6
1.3.3 kdd與數據挖掘的關係 7
1.3.4 線上分析處理(olap)與數據挖掘的關係 7
1.3.5 數據挖掘與機器學習的關係 8
.1.3.6 web挖掘和數據挖掘有什麼不同 8
1.4 數據挖掘在客戶關係管理中的套用 9
1.4.1 客戶關係管理(crm) 9
1.4.2 客戶關係管理指標 10
1.4.3 數據挖掘套用於各行業 13
1.4.4 客戶市場區隔 14
1.4.5 交叉銷售 15
1.4.6 客戶關係管理四大循環過程 15
1.4.7 資料庫行銷 16
1.5 數據倉庫定義 17
1.5.1 數據倉庫特性 17
1.5.2 數據倉庫架構 18
1.5.3 構建數據倉庫的原因 19
1.5.4 構建數據倉庫的主要目的 19
1.5.5 數據倉庫的套用 20
1.5.6 數據倉庫的管理 20
1.6 數據挖掘工具分類 21
1.6.1 數據挖掘工具 21
1.6.2 各工具的簡介 21
第2章 sql語言介紹及其實例 22
2.1 sql簡介及數據變數來源說明 22
2.1.1 何謂sql 22
2.1.2 各數據文檔變數說明 23
2.2 sql基本語法介紹 25
2.3 會員基本資料整理 40
2.3.1 查詢縣市別填答狀態 40
2.3.2 婚姻狀態 42
2.4 會員基本變項 43
2.4.1 性別 43
2.4.2 交易周期性變化 49
2.4.3 會員在交易時的年齡及婚姻狀態 52
2.4.4 會員交易金額及紅利積點次數分配百分比 55
2.4.5 平均交易間隔時間 59
2.5 產品組合 62
2.5.1 按照產品編號排行榜 63
2.5.2 單項產品的排行榜 68
2.5.3 重複購買率 71
2.6 會員流失率 79
2.7 會員貢獻度 83
第3章 sql server 2008的數據挖掘模型在零售業中的套用 86
3.1 實際案例練習 86
3.1.1 數據挖掘microsoft決策樹 87
3.1.2 數據挖掘microsoft羅吉斯回歸 90
3.1.3 數據挖掘microsoft類神經網路 93
3.1.4 數據挖掘microsoft貝氏機率分類 97
3.2 潛在客戶預測模型 99
3.2.1 潛在客戶預測流程圖 99
3.2.2 交易頻率趨勢圖 100
3.2.3 交易頻率語法 101
3.3 模型建構 102
3.3.1 ssis操作流程 102
3.3.2 ssas操作流程 113
3.3.3 數據挖掘microsoft決策樹模型建構 118
3.3.4 數據挖掘microsoft羅吉斯回歸模型建構 128
3.3.5 數據挖掘microsoft類神經網路及貝氏機率模型建構 130
3.3.6 模型比較 132
3.4 數據挖掘microsoft時間序列 140
3.4.1 基本概念 140
3.4.2 時間序列的成分 142
3.4.3 時間序列數據的圖形介紹 143
3.4.4 利用修勻法預測 147
3.4.5 用趨勢投射預測時間序列 150
3.4.6 預測含趨勢與季節成分的時間序列 151
3.4.7 利用回歸模型預測時間序列 152
3.4.8 其他預測模型 153
3.4.9 模型單變數時間序列預測模型 153
3.4.10 時間趨勢預測模型 155
3.4.11 範例操作 156
3.5 數據挖掘microsoft聚類分析 165
3.5.1 基本概念 165
3.5.2 範例操作 167
3.6 數據挖掘microsoft線性回歸 182
3.6.1 基本概念 182
3.6.2 簡單線性回歸分析 184
3.6.3 多元回歸分析 184
3.6.4 嶺回歸分析 184
3.6.5 範例操作 185
3.6.6 補充(測試集數據匯出) 205
3.7 數據挖掘microsoft關聯規則 208
3.7.1 基本概念 208
3.7.2 關聯規則的種類 209
3.7.3 關聯規則的算法:apriori算法 209
3.7.4 關聯規則dmx數據挖掘語法 210
3.8 數據挖掘microsoft時序群集 211
3.8.1 基本概念 211
3.8.2 相關研究 211
3.8.3 時序群集dmx數據挖掘語法 212
第4章 olap在零售業中的套用 214
4.1 數據倉庫 214
4.2 實例操作 217
4.2.1 數據來源檢查 217
4.2.2 創建命名查詢(vip會員數據) 222
4.2.3 編輯命名查詢(vip產品組成貨號) 224
4.2.4 編輯命名查詢(vip訂單明細表) 225
4.2.5 編輯命名查詢(vip訂單數) 225
4.2.6 編輯命名查詢(vip購買產品) 225
4.2.7 編輯命名查詢(vip會員數) 226
4.3 維度設計 227
4.4 建立多維數據集 238
4.4.1 對企業的價值 238
4.4.2 數據儲存的選擇性 239
4.4.3 實例操作 240
4.5 數據模擬及相關數據明細 249
第5章 excel中的數據挖掘模組 253
5.1 安裝與設定數據挖掘載入宏 253
5.1.1 系統需求 253
5.1.2 開始安裝 253
5.1.3 完成安裝檢查 256
5.1.4 狀態設定 256
5.1.5 設定完成檢查 259
5.2 excel 2007數據挖掘工具列介紹 260
5.2.1 數據挖掘使用幫助 260
5.2.2 數據挖掘連線設定 261
5.2.3 設定目前的連線 261
5.2.4 跟蹤 263
5.2.5 數據準備 263
5.2.6 瀏覽數據 263
5.2.7 清除數據 266
5.2.8 為數據分區 267
5.2.9 數據建模 270
5.2.10 準確性和驗證 270
5.2.11 精確度圖表 270
5.2.12 分類矩陣 271
5.2.13 利潤圖 272
5.2.14 模型使用方法 272
5.2.15 瀏覽 272
5.2.16 查詢 275
5.2.17 模型管理 275
5.2.18 重命名此挖掘結構 276
5.2.19 刪除此挖掘結構 276
5.2.20 清除此挖掘結構 276
5.2.21 使用原始數據處理此挖掘結構 277
5.2.22 用新數據處理此挖掘結構 277
5.2.23 導出此挖掘結構 278
5.2.24 導入 278
附錄 279