數據挖掘原理與套用——SQL Serer 2005 資料庫

數據挖掘原理與套用——SQL Serer 2005 資料庫

《數據挖掘原理與套用——SQL Serer 2005 資料庫》是2007年清華大學出版社出版的圖書,作者是Tang Z.H.。

基本介紹

  • 書名:數據挖掘原理與套用——SQL Serer 2005 資料庫
  • 作者:[美] 唐(Tang Z.H.) 
  • 譯者:鄺祝芳、焦賢龍
  • 定價:46元
  • 出版社:清華大學出版社
  • 出版時間:2007-01-01
  • 裝幀:平裝
  • 開本:16開 
內容簡介,目錄,

內容簡介


本書作為一本專家級指南,全面介紹了SQLServer2005中數據挖掘的功能,並且對這些功能的套用作了較為詳盡的講述。書中不但講述了數據挖掘的核心概念,還講述了數據挖掘的最新發展趨勢,並給出了一些數據挖掘的最佳實踐。

目錄

第1章 數據挖掘導論
1.1 什麼是數據挖掘
1.2 數據挖掘解決的商業問題
1.3 數據挖掘的任務
1.3.1 分類
1.3.2 聚類
1.3.3 關聯
1.3.4 回歸
1.3.5 預測
1.3.6 序列分析
1.3.7 偏差分析
1.4 數據挖掘技術
1.5 數據流
1.6 數據挖掘項目的生命周期
1.6.1 第1步:數據收集
1.6.2 第2步:數據清理和轉換
1.6.3 第3步:模型構建
1.6.4 第4步:模型評估
1.6.5 第5步:報告
1.6.6 第6步:預測(評分)
1.6.7 第7步:套用集成
1.6.8 第8步:模型管理
1.7 數據挖掘當前市場與主要廠商
1.7.1 數據挖掘市場的大小
1.7.2 主要生產廠商和產品
1.8 目前存在的問題及挑戰
1.9 數據挖掘標準
1.10 OLE DB for DM規範和XML for Analysis規範
1.10.1 用於數據挖掘的SQL/Multimedia
1.10.2 Java數據挖掘API
1.10.3 預測模型標記語言
1.10.4 Crisp-DM模型
1.10.5 公共倉庫元數據
1.11 數據挖掘的新趨勢
1.12 本章小結
第2章 OLE DB for DM規範
2.1 OLE DB介紹
2.2 為什麼使用OLE DB進行數據挖掘
2.3 OLE DB for DM規範中的基本概念
2.3.1 事例
2.3.2 事例鍵
2.3.3 嵌套健
2.3.4 事例表和嵌套表
2.3.5 標量列和表列
2.3.6 數據挖掘模型
2.3.7 模型創建
2.3.8 模型訓練
2.3.9 模型預測
2.4 DMX
2.4.1 數據挖掘的3個步驟
2.4.2 預測函式
2.4.3 單例查詢
2.4.4 僅僅使用內容進行預測
2.4.5 鑽取模型的內容
2.4.6 內容查詢
2.5 理解模式行集
2.5.1 Mining-Services模型行集
2.5.2Service_Parameters模式行集 54
2.5.3Mining_Models模式行集 54
2.5.4Mining_Columns模式行集 55
2.5.5Mining_Model_Content模式行集 55
2.5.6Query_Content模式行集 58
2.5.7Mining_Functions模式行集 59
2.5.8Model_PMML模式行集 60
2.6理解用於挖掘結構的DMX擴展 60
2.6.1挖掘結構 60
2.6.2挖掘結構的DMX擴展 61
2.6.3MiningStructure模式行集 62
2.7本章小結 63
第3章實踐SQLServer數據挖掘 65
3.1BIDevStudio介紹 65
3.1.1理解用戶界面 66
3.1.2脫機模式和即時模式 68
3.2設定數據源 72
3.2.1數據源 72
3.2.2使用數據源視圖 74
3.3創建和編輯模型 83
3.3.1結構和模型 83
3.3.2使用數據挖掘嚮導 83
3.3.3創建MovieClick挖掘結構和挖掘模型 88
3.3.4使用數據挖掘設計器 89
3.4處理 94
3.5使用模型 96
3.5.1了解模型查看器 96
3.5.2使用挖掘準確性圖表 98
3.5.3為MovieClick模型創建一個提升圖 101
3.5.4使用挖掘模型預測 101
3.5.5針對MovieClick模型執行查詢 102
3.5.6創建數據挖掘報表 103
3.6使用SQLServerManagementStudio 104
3.6.1了解ManagementStudio用戶界面 105
3.6.2使用對象資源管理器 106
3.6.3使用查詢編輯器 106
3.7本章小結 107
第4章Microsoft貝葉斯算法 109
4.1貝葉斯算法介紹 109
4.2理解貝葉斯算法的基本原理 110
4.3貝葉斯算法的參數 112
4.4使用貝葉斯算法 113
4.4.1DMX 114
4.4.2理解貝葉斯模型的內容 115
4.4.3瀏覽貝葉斯模型 117
4.5本章小結 120
第5章Microsoft決策樹算法 121
5.1決策樹算法介紹 121
5.2決策樹算法的基本原理 122
5.2.1決策樹生成的基本思想 122
5.2.2處理變數中的多個狀態 125
5.2.3避免過度訓練 125
5.2.4結合先驗知識 126
5.2.5特徵選擇 126
5.2.6使用連續的輸入屬性 127
5.2.7回歸 127
5.2.8使用Microsoft決策樹算法進行關聯分析 128
5.3理解算法參數 129
5.4使用決策樹算法 131
5.4.1DMX查詢 131
5.4.2模型內容 135
5.4.3解釋模型 136
5.5本章小結 139
第6章Microsoft時序算法 141
6.1Microsoft時序算法介紹 141
6.2Microsoft時序算法的基本原理 142
6.2.1自動回歸 142
6.2.2使用多個時間序列 144
6.2.3自動回歸樹 144
6.2.4季節性 145
6.2.5預測歷史 146
6.2.6高速快取預測 146
6.3理解時序算法的參數 147
6.4使用Microsoft時序算法 148
6.4.1DMX查詢 148
6.4.2模型內容 152
6.4.3模型解釋 152
6.5本章小結 155
第7章Microsoft聚類算法 157
7.1Microsoft聚類算法介紹 158
7.2聚類算法的基本原理 159
7.2.1硬聚類算法與軟聚類算法 160
7.2.2離散聚類 161
7.2.3可伸縮聚類 162
7.2.4聚類預測 163
7.3聚類算法的參數 163
7.4使用聚類模型 166
7.4.1將聚類作為一個分析步驟 166
7.4.2DMX 167
7.4.3模型內容 169
7.4.4理解聚類模型 169
7.5本章小結 174
第8章Microsoft序列聚類算法 175
8.1Microsoft序列聚類算法介紹 175
8.2Microsoft序列聚類算法的基本原理 176
8.2.1什麼是馬爾可夫鏈 176
8.2.2馬爾可夫鏈的階 176
8.2.3狀態轉移矩陣 177
8.2.4使用馬爾可夫鏈來進行聚類 178
8.2.5聚類分解 180
8.3序列聚類算法的參數 180
8.4使用序列聚類算法 181
8.4.1DMX查詢 181
8.4.2模型內容 185
8.4.3解釋模型 185
8.5本章小結 189
第9章Microsoft關聯規則算法 191
9.1Microsoft關聯規則算法介紹 191
9.2關聯規則算法的基本原理 192
9.2.1理解關聯規則算法的基本概念 192
9.2.2挖掘頻繁項集 195
9.2.3生成關聯規則 198
9.2.4預測 198
9.3關聯算法的參數 199
9.4使用關聯算法 200
9.4.1DMX查詢 200
9.4.2模型內容 202
9.4.3解釋模型 203
9.5本章小結 205
第10章Microsoft神經網路算法 207
10.1Microsoft神經網路算法的基本原理 207
10.1.1什麼是神經網路 208
10.1.2組合和激活 209
10.1.3反向傳播、誤差函式和共軛梯度 211
10.1.4處理神經網路的簡單示例 212
10.1.5規範化和映射 213
10.1.6網路拓撲 214
10.1.7訓練終止條件 215
10.2神經網路算法的參數 215
10.3DMX查詢 216
10.4模型內容 218
10.5解釋模型 219
10.6本章小結 221
第11章挖掘OLAP立方體 223
11.1OLAP介紹 224
11.1.1理解星型模式和雪花模式 225
11.1.2理解維和層次 225
11.1.3理解度量和度量組 226
11.1.4理解立方體的處理和存儲 227
11.1.5使用前攝快取 228
11.1.6查詢立方體 228
11.2執行計算 229
11.3瀏覽立方體 230
11.4理解統一維度模型 231
11.5理解OLAP和數據挖掘之間的關係 234
11.5.1OLAP在聚集數據方面給數據挖掘帶來的好處 235
11.5.2OLAP需要數據挖掘來發現模式 235
11.5.3OLAP挖掘與關係挖掘 236
11.6使用嚮導和編輯器來構建OLAP挖掘模型 237
11.6.1使用數據挖掘嚮導 237
11.6.2構建客戶細分模型 237
11.6.3創建購物籃模型 239
11.6.4創建銷售預測模型 242
11.6.5使用數據挖掘編輯器 245
11.7理解數據挖掘維 246
11.8在DMX查詢內部使用MDX 248
11.9將AMO用於OLAP挖掘模型 249
11.10本章小結 253
第12章SQLServer集成服務數據挖掘 255
12.1SSIS介紹 255
12.1.1理解SSIS包 257
12.1.2任務流 257
12.1.3數據流 259
12.2在SSIS環境中進行數據挖掘 261
12.2.1數據挖掘任務 262
12.2.2數據挖掘轉換 267
12.3本章小結 276
第13章SQLServer數據挖掘的體系結構 277
13.1AnalysisServices體系結構介紹 277
13.2XMLforAnalysis 278
13.2.1XMLA的API 279
13.2.2XMLA和AnalysisServices 282
13.3處理體系結構 283
13.4數據挖掘管理 284
13.4.1伺服器配置 284
13.4.2數據挖掘安全 285
13.5本章小結 287
第14章SQLServer數據挖掘編程 289
14.1數據挖掘API 290
14.1.1ADO 291
14.1.2ADO.NET 291
14.1.3ADOMD.NET 291
14.1.4ServerADOMD 292
14.1.5AMO 292
14.2使用AnalysisServices的API 292
14.3使用Microsoft.AnalysisServices創建和管理挖掘模型 293
14.3.1AMO的基本原理 294
14.3.2AMO應用程式和安全 295
14.3.3對象的創建 296
14.4瀏覽和查詢挖掘模型 305
14.4.1使用ADOMD.NET來預測 306
14.4.2瀏覽模型 309
14.4.3存儲過程 311
14.4.4編寫存儲過程 312
14.5本章小結 317
第15章實現一個Web交叉銷售應用程式 319
15.1源數據描述 319
15.2構建模型 320
15.2.1確定數據挖掘任務 320
15.2.2將決策樹算法套用於關聯任務 320
15.2.3使用關聯規則算法 322
15.2.4兩個模型的比較 324
15.3執行預測 325
15.3.1批處理預測查詢 325
15.3.2使用單例預測查詢 327
15.4在Web應用程式中
集成預測功能 327
15.4.1理解Web應用程式的體系結構 327
15.4.2設定許可權 328
15.4.3分析Web推薦應用程式的樣例代碼 329
15.5本章小結 332
第16章使用MicrosoftExcel進行高級預測 333
16.1針對會話模型來配置AnalysisServices 333
16.2使用高級預測工具 334
16.3ExcelTimeSeries外掛程式的體系結構 336
16.4構建輸入數據集 336
16.5創建和訓練挖掘模型 339
16.5.1連線數據挖掘引擎 339
16.5.2創建和訓練 340
16.6預測序列 342
16.7結合所有代碼 343
16.8本章小結 346
第17章擴展SQLServer數據挖掘 347
17.1理解外掛程式算法 347
17.1.1外掛程式算法的架構 348
17.1.2外掛程式算法的概念 348
17.1.3模型的創建和處理 350
17.1.4預測 351
17.1.5內容導航 352
17.1.6受託管的外掛程式 352
17.1.7安裝外掛程式算法 353
17.2使用數據挖掘查看器 353
17.3本章小結 354
第18章總結與其他資源 355
18.1重新回顧SQLServer2005數據挖掘的亮點 355
18.1.1最新的算法 355
18.1.2易於使用的工具 356
18.1.3簡單而強大的API 356
18.1.4與同類BI技術的集成 357
18.2探討數據挖掘的新領域及套用 357
18.3延伸閱讀 358
18.3.1Microsoft數據挖掘的資源 358
18.3.2數據挖掘的其他資源 358
18.3.3流行的數據挖掘Web站點 359
18.3.4流行的數據挖掘會議 359
附錄A導入數據集 361
A.1數據集 361
A.1.1MovieClick數據集 361
A.1.2VotingRecords數據集 363
A.1.3FoodMart2000數據集 364
A.1.4CollegePlans數據集 364
A.2導入數據集 364
附錄B支持的VBA函式和Excel函式 369
附錄C學習資源 373

相關詞條

熱門詞條

聯絡我們