數據挖掘原理與套用——SQL Serer 2005 資料庫

數據挖掘原理與套用——SQL Serer 2005 資料庫

《數據挖掘原理與套用——SQL Serer 2005 資料庫》是2007年清華大學出版社出版的圖書，作者是Tang Z.H.。

基本介紹

中文名：數據挖掘原理與套用——SQL Serer 2005 資料庫
作者：[美] 唐（Tang Z.H.）
譯者：鄺祝芳、焦賢龍
出版社：清華大學出版社
出版時間：2007年01月01日
定價：46 元
開本：16 開
裝幀：平裝
ISBN：9787302140009

內容簡介,目錄,

內容簡介

本書作為一本專家級指南，全面介紹了SQLServer2005中數據挖掘的功能，並且對這些功能的套用作了較為詳盡的講述。書中不但講述了數據挖掘的核心概念，還講述了數據挖掘的最新發展趨勢，並給出了一些數據挖掘的最佳實踐。

目錄

第1章　數據挖掘導論

1.1　什麼是數據挖掘

1.2　數據挖掘解決的商業問題

1.3　數據挖掘的任務

1.3.1　分類

1.3.2　聚類

1.3.3　關聯

1.3.4　回歸

1.3.5　預測

1.3.6　序列分析

1.3.7　偏差分析

1.4　數據挖掘技術

1.5　數據流

1.6　數據挖掘項目的生命周期

1.6.1　第1步：數據收集

1.6.2　第2步：數據清理和轉換

1.6.3　第3步：模型構建

1.6.4　第4步：模型評估

1.6.5　第5步：報告

1.6.6 第6步：預測（評分）

1.6.7　第7步：套用集成

1.6.8　第8步：模型管理

1.7　數據挖掘當前市場與主要廠商

1.7.1　數據挖掘市場的大小

1.7.2　主要生產廠商和產品

1.8　目前存在的問題及挑戰

1.9　數據挖掘標準

1.10　OLE DB for DM規範和XML for Analysis規範

1.10.1　用於數據挖掘的SQL/Multimedia

1.10.2　Java數據挖掘API

1.10.3　預測模型標記語言

1.10.4　Crisp－DM模型

1.10.5　公共倉庫元數據

1.11　數據挖掘的新趨勢

1.12　本章小結

第2章　OLE DB for DM規範

2.1　OLE DB介紹

2.2　為什麼使用OLE DB進行數據挖掘

2.3　OLE DB for DM規範中的基本概念

2.3.1　事例

2.3.2　事例鍵

2.3.3　嵌套健

2.3.4　事例表和嵌套表

2.3.5　標量列和表列

2.3.6　數據挖掘模型

2.3.7　模型創建

2.3.8　模型訓練

2.3.9　模型預測

2.4　DMX

2.4.1　數據挖掘的3個步驟

2.4.2　預測函式

2.4.3　單例查詢

2.4.4　僅僅使用內容進行預測

2.4.5　鑽取模型的內容

2.4.6　內容查詢

2.5　理解模式行集

2.5.1　Mining－Services模型行集

2.5.2Service_Parameters模式行集 54

2.5.3Mining_Models模式行集 54

2.5.4Mining_Columns模式行集 55

2.5.5Mining_Model_Content模式行集 55

2.5.6Query_Content模式行集 58

2.5.7Mining_Functions模式行集 59

2.5.8Model_PMML模式行集 60

2.6理解用於挖掘結構的DMX擴展 60

2.6.1挖掘結構 60

2.6.2挖掘結構的DMX擴展 61

2.6.3MiningStructure模式行集 62

2.7本章小結 63

第3章實踐SQLServer數據挖掘 65

3.1BIDevStudio介紹 65

3.1.1理解用戶界面 66

3.1.2脫機模式和即時模式 68

3.2設定數據源 72

3.2.1數據源 72

3.2.2使用數據源視圖 74

3.3創建和編輯模型 83

3.3.1結構和模型 83

3.3.2使用數據挖掘嚮導 83

3.3.3創建MovieClick挖掘結構和挖掘模型 88

3.3.4使用數據挖掘設計器 89

3.4處理 94

3.5使用模型 96

3.5.1了解模型查看器 96

3.5.2使用挖掘準確性圖表 98

3.5.3為MovieClick模型創建一個提升圖 101

3.5.4使用挖掘模型預測 101

3.5.5針對MovieClick模型執行查詢 102

3.5.6創建數據挖掘報表 103

3.6使用SQLServerManagementStudio 104

3.6.1了解ManagementStudio用戶界面 105

3.6.2使用對象資源管理器 106

3.6.3使用查詢編輯器 106

3.7本章小結 107

第4章Microsoft貝葉斯算法 109

4.1貝葉斯算法介紹 109

4.2理解貝葉斯算法的基本原理 110

4.3貝葉斯算法的參數 112

4.4使用貝葉斯算法 113

4.4.1DMX 114

4.4.2理解貝葉斯模型的內容 115

4.4.3瀏覽貝葉斯模型 117

4.5本章小結 120

第5章Microsoft決策樹算法 121

5.1決策樹算法介紹 121

5.2決策樹算法的基本原理 122

5.2.1決策樹生成的基本思想 122

5.2.2處理變數中的多個狀態 125

5.2.3避免過度訓練 125

5.2.4結合先驗知識 126

5.2.5特徵選擇 126

5.2.6使用連續的輸入屬性 127

5.2.7回歸 127

5.2.8使用Microsoft決策樹算法進行關聯分析 128

5.3理解算法參數 129

5.4使用決策樹算法 131

5.4.1DMX查詢 131

5.4.2模型內容 135

5.4.3解釋模型 136

5.5本章小結 139

第6章Microsoft時序算法 141

6.1Microsoft時序算法介紹 141

6.2Microsoft時序算法的基本原理 142

6.2.1自動回歸 142

6.2.2使用多個時間序列 144

6.2.3自動回歸樹 144

6.2.4季節性 145

6.2.5預測歷史 146

6.2.6高速快取預測 146

6.3理解時序算法的參數 147

6.4使用Microsoft時序算法 148

6.4.1DMX查詢 148

6.4.2模型內容 152

6.4.3模型解釋 152

6.5本章小結 155

第7章Microsoft聚類算法 157

7.1Microsoft聚類算法介紹 158

7.2聚類算法的基本原理 159

7.2.1硬聚類算法與軟聚類算法 160

7.2.2離散聚類 161

7.2.3可伸縮聚類 162

7.2.4聚類預測 163

7.3聚類算法的參數 163

7.4使用聚類模型 166

7.4.1將聚類作為一個分析步驟 166

7.4.2DMX 167

7.4.3模型內容 169

7.4.4理解聚類模型 169

7.5本章小結 174

第8章Microsoft序列聚類算法 175

8.1Microsoft序列聚類算法介紹 175

8.2Microsoft序列聚類算法的基本原理 176

8.2.1什麼是馬爾可夫鏈 176

8.2.2馬爾可夫鏈的階 176

8.2.3狀態轉移矩陣 177

8.2.4使用馬爾可夫鏈來進行聚類 178

8.2.5聚類分解 180

8.3序列聚類算法的參數 180

8.4使用序列聚類算法 181

8.4.1DMX查詢 181

8.4.2模型內容 185

8.4.3解釋模型 185

8.5本章小結 189

第9章Microsoft關聯規則算法 191

9.1Microsoft關聯規則算法介紹 191

9.2關聯規則算法的基本原理 192

9.2.1理解關聯規則算法的基本概念 192

9.2.2挖掘頻繁項集 195

9.2.3生成關聯規則 198

9.2.4預測 198

9.3關聯算法的參數 199

9.4使用關聯算法 200

9.4.1DMX查詢 200

9.4.2模型內容 202

9.4.3解釋模型 203

9.5本章小結 205

第10章Microsoft神經網路算法 207

10.1Microsoft神經網路算法的基本原理 207

10.1.1什麼是神經網路 208

10.1.2組合和激活 209

10.1.3反向傳播、誤差函式和共軛梯度 211

10.1.4處理神經網路的簡單示例 212

10.1.5規範化和映射 213

10.1.6網路拓撲 214

10.1.7訓練終止條件 215

10.2神經網路算法的參數 215

10.3DMX查詢 216

10.4模型內容 218

10.5解釋模型 219

10.6本章小結 221

第11章挖掘OLAP立方體 223

11.1OLAP介紹 224

11.1.1理解星型模式和雪花模式 225

11.1.2理解維和層次 225

11.1.3理解度量和度量組 226

11.1.4理解立方體的處理和存儲 227

11.1.5使用前攝快取 228

11.1.6查詢立方體 228

11.2執行計算 229

11.3瀏覽立方體 230

11.4理解統一維度模型 231

11.5理解OLAP和數據挖掘之間的關係 234

11.5.1OLAP在聚集數據方面給數據挖掘帶來的好處 235

11.5.2OLAP需要數據挖掘來發現模式 235

11.5.3OLAP挖掘與關係挖掘 236

11.6使用嚮導和編輯器來構建OLAP挖掘模型 237

11.6.1使用數據挖掘嚮導 237

11.6.2構建客戶細分模型 237

11.6.3創建購物籃模型 239

11.6.4創建銷售預測模型 242

11.6.5使用數據挖掘編輯器 245

11.7理解數據挖掘維 246

11.8在DMX查詢內部使用MDX 248

11.9將AMO用於OLAP挖掘模型 249

11.10本章小結 253

第12章SQLServer集成服務數據挖掘 255

12.1SSIS介紹 255

12.1.1理解SSIS包 257

12.1.2任務流 257

12.1.3數據流 259

12.2在SSIS環境中進行數據挖掘 261

12.2.1數據挖掘任務 262

12.2.2數據挖掘轉換 267

12.3本章小結 276

第13章SQLServer數據挖掘的體系結構 277

13.1AnalysisServices體系結構介紹 277

13.2XMLforAnalysis 278

13.2.1XMLA的API 279

13.2.2XMLA和AnalysisServices 282

13.3處理體系結構 283

13.4數據挖掘管理 284

13.4.1伺服器配置 284

13.4.2數據挖掘安全 285

13.5本章小結 287

第14章SQLServer數據挖掘編程 289

14.1數據挖掘API 290

14.1.1ADO 291

14.1.2ADO.NET 291

14.1.3ADOMD.NET 291

14.1.4ServerADOMD 292

14.1.5AMO 292

14.2使用AnalysisServices的API 292

14.3使用Microsoft.AnalysisServices創建和管理挖掘模型 293

14.3.1AMO的基本原理 294

14.3.2AMO應用程式和安全 295

14.3.3對象的創建 296

14.4瀏覽和查詢挖掘模型 305

14.4.1使用ADOMD.NET來預測 306

14.4.2瀏覽模型 309

14.4.3存儲過程 311

14.4.4編寫存儲過程 312

14.5本章小結 317

第15章實現一個Web交叉銷售應用程式 319

15.1源數據描述 319

15.2構建模型 320

15.2.1確定數據挖掘任務 320

15.2.2將決策樹算法套用於關聯任務 320

15.2.3使用關聯規則算法 322

15.2.4兩個模型的比較 324

15.3執行預測 325

15.3.1批處理預測查詢 325

15.3.2使用單例預測查詢 327

15.4在Web應用程式中

集成預測功能 327

15.4.1理解Web應用程式的體系結構 327

15.4.2設定許可權 328

15.4.3分析Web推薦應用程式的樣例代碼 329

15.5本章小結 332

第16章使用MicrosoftExcel進行高級預測 333

16.1針對會話模型來配置AnalysisServices 333

16.2使用高級預測工具 334

16.3ExcelTimeSeries外掛程式的體系結構 336

16.4構建輸入數據集 336

16.5創建和訓練挖掘模型 339

16.5.1連線數據挖掘引擎 339

16.5.2創建和訓練 340

16.6預測序列 342

16.7結合所有代碼 343

16.8本章小結 346

第17章擴展SQLServer數據挖掘 347

17.1理解外掛程式算法 347

17.1.1外掛程式算法的架構 348

17.1.2外掛程式算法的概念 348

17.1.3模型的創建和處理 350

17.1.4預測 351

17.1.5內容導航 352

17.1.6受託管的外掛程式 352

17.1.7安裝外掛程式算法 353

17.2使用數據挖掘查看器 353

17.3本章小結 354

第18章總結與其他資源 355

18.1重新回顧SQLServer2005數據挖掘的亮點 355

18.1.1最新的算法 355

18.1.2易於使用的工具 356

18.1.3簡單而強大的API 356

18.1.4與同類BI技術的集成 357

18.2探討數據挖掘的新領域及套用 357

18.3延伸閱讀 358

18.3.1Microsoft數據挖掘的資源 358

18.3.2數據挖掘的其他資源 358

18.3.3流行的數據挖掘Web站點 359

18.3.4流行的數據挖掘會議 359

附錄A導入數據集 361

A.1數據集 361

A.1.1MovieClick數據集 361

A.1.2VotingRecords數據集 363

A.1.3FoodMart2000數據集 364

A.1.4CollegePlans數據集 364

A.2導入數據集 364

附錄B支持的VBA函式和Excel函式 369

附錄C學習資源 373

相關詞條

熱門詞條

聯絡我們