《Microsoft數據倉庫工具箱(第2版)——使用SQL Server 2008 R2和Microsoft BI工具集》是2012年5月24日出版的圖書,作者是Joy Mundy等。
基本介紹
- 書名:Microsoft數據倉庫工具箱(第2版)——使用SQL Server 2008 R2和Microsoft BI工具集
- 作者:Joy Mundy、Warren Thornthwaite、Ralph Kimball
- 譯者:包戰 、孔祥亮
- ISBN:9787302283362
- 定價:78元
- 裝幀:平裝
圖書簡介,目錄,
圖書簡介
作為數據倉庫和商業智慧型領域最有影響力的思想領袖,KimballGroup開發了一系列開拓性的技術,均已成為DW/BI系統設計、開發和管理的業界標準。在這本暢銷書的新版本中,KimballGroup中經驗豐富的專家介紹了如何快速掌握SQLServer的新商業智慧型版本:SQLServer2008R2。《Microsoft數據倉庫工具箱(第2版)—使用SQLSever2008R2和MicrosoftBI工具集》涵蓋了SQLServer2008R2中全套的數據倉庫和BI工具,介紹了項目的整個生命周期,包括設計、開發、部署和維護。
《Microsoft數據倉庫工具箱(第2版)—使用SQLSever2008R2和MicrosoftBI工具集》更新了上一版的大量內容,介紹了SQLServer2008R2的新功能,例如PowerPivot和MasterDataServices,還用翔實的示例說明如何更好地套用本書描述的技術。作者分享了他們使用Microsoft工具構建DW/BI系統的經驗,讀者可以從中了解他們遇到的挑戰,分享他們的成功。還可以學習在使用Kimball生命周期建立自己的DW/BI系統時,應如何遵循4個基本原則:關注業務,構建信息基礎架構,提供有意義的增量價值以及交付完整的解決方案。有了這4個原則,就可以構建成功的DW/BI系統,以支持大多數公司都有的商業智慧型需求。
無論您在DW/BI項目中的工作是什麼,本書對您都是有益的:
◆如何尋找最佳機會
◆選擇、安裝、配置SQLServer2008R2的適當組件和其他Microsoft產品
◆設計維度模型,創建關係資料庫和AnalysisServices資料庫的結構
◆在IntegrationServices中構建ETL系統以填充DW/BI資料庫
◆構建BI應用程式和數據挖掘模型,為公司提供有價值的信息
◆管理、保護和擴展DW/BI系統以獲得持續的成功
目錄
第Ⅰ部分需求、現實情況和體系結構
第1章定義業務需求 3
1.1長期成功的最重要的決定因素 4
1.2AdventureWorksCycles簡介 5
1.3揭示業務價值 5
1.3.1獲得贊助商關係 6
1.3.2定義企業級業務需求 6
1.4設定業務需求的優先權 17
1.5項目規劃 19
1.6收集項目需求 20
1.7小結 21
第2章業務過程維度模型設計 23
2.1維度建模概念和術語 24
2.1.1事實表 25
2.1.2維度 26
2.1.3整合事實和維度 27
2.1.4匯流排矩陣、一致性維度和
交叉探查 28
2.2其他設計概念和技術 30
2.2.1代理鍵 30
2.2.2漸變維度 31
2.2.3日期 32
2.2.4退化維度 33
2.2.5雪花模型 33
2.2.6多對多維度或多值維度 34
2.2.7層次結構 36
2.2.8聚合維度 38
2.2.9無意義維度 39
2.2.103種事實表類型 40
2.2.11聚合 41
2.3維度建模過程 41
2.3.1準備工作 42
2.3.2數據剖析和研究 45
2.3.3構建維度模型 47
2.3.4開發詳細維度模型 50
2.3.5模型測試和細化 51
2.3.6評審和驗證模型 51
2.4案例研究:AdventureWorks
Cycles訂單維度模型 51
2.4.1訂單事實表 51
2.4.2維度 52
2.4.3確定訂單業務過程的維度
屬性和事實 54
2.4.4初始訂單模型的最終草圖 55
2.4.5詳細訂單維度模型開發 56
2.4.6最終的維度模型 57
2.5小結 57
第3章工具集 59
3.1MicrosoftDW/BI工具集 60
3.2使用Microsoft工具集的
原因 61
3.3MicrosoftDW/BI系統的體系
結構 61
3.3.1包含AnalysisServices的
原因 63
3.3.2存儲在關係資料庫中的原因 64
3.3.3ETL不是可選的 64
3.3.4MasterDataServices的作用 65
3.3.5交付BI應用程式 65
3.4Microsoft工具概述 66
3.4.1需要的產品 66
3.4.2SQLServer開發和管理工具 68
3.5小結 71
第4章系統設定 73
4.1系統規模的考慮事項 74
4.1.1計算數據卷 74
4.1.2確定套用複雜度 75
4.1.3估計並發用戶數 76
4.1.4評估系統可用性需求 77
4.1.5系統的規模 77
4.2系統配置考慮事項 77
4.2.1記憶體 77
4.2.2一體化還是分散式 78
4.2.3存儲系統考慮事項 80
4.2.4處理器 83
4.2.5高可用性設定 83
4.3軟體安裝和配置 84
4.3.1開發環境的軟體需求 85
4.3.2測試和產品系統的軟體需求 88
4.3.3作業系統 89
4.3.4SQLServer關係資料庫設定 89
4.3.5AnalysisServices設定 92
4.3.6IntegrationServices設定 94
4.3.7ReportingServices設定 95
4.4小結 96
第Ⅱ部分建立和填充資料庫
第5章創建關係數據倉庫 99
5.1開始 100
5.2完成物理設計 101
5.2.1代理鍵 101
5.2.2字元串列 101
5.2.3空或非空 102
5.2.4常規事務列 103
5.2.5數據表和列的擴展屬性 104
5.3定義存儲器並創建約束
和支持對象 104
5.3.1創建檔案和檔案組 104
5.3.2數據壓縮 105
5.3.3實體和引用完整性約束 106
5.3.4初始索引和資料庫統計 107
5.3.5聚合表 109
5.3.6創建數據表視圖 110
5.3.7插入未知成員行 111
5.3.8CREATETABLE語句示例 111
5.4分區表 112
5.4.1分區表的工作方式 112
5.4.2管理分區表 115
5.5收尾 119
5.5.1中間表 119
5.5.2元數據設定 119
5.6小結 120
第6章主數據的管理 121
6.1管理主引用數據 122
6.1.1屬性不完整 122
6.1.2數據集成 123
6.1.3系統集成 124
6.1.4主數據管理系統和數據倉庫 125
6.2SQLServer主數據服務 125
6.2.1模型定義功能 125
6.2.2數據管理功能 127
6.3創建簡單的應用程式 131
6.3.1業務場景 131
6.3.2儘可能簡單 131
6.3.3創建MDS模型 132
6.3.4載入子類別成員 134
6.3.5改進模型 135
6.3.6導出到數據倉庫 136
6.4小結 136
第7章設計和開發ETL系統 137
7.1確定需求 138
7.2制定ETL計畫 139
7.3SQLServerIntegrationServices概述 141
7.3.1控制流和數據流 142
7.3.2SSIS程式包的體系結構 145
7.4ETL的主要子系統 145
7.5提取數據 146
7.5.1子系統1:數據剖析 146
7.5.2子系統2:更改數據捕獲系統 146
7.5.3子系統3:提取系統 148
7.6清理和一致化數據 151
7.6.1子系統4:數據清理系統 152
7.6.2子系統5:錯誤事件模式 158
7.6.3子系統6:審核維度彙編器 158
7.6.4子系統7:重複數據刪除系統 159
7.6.5子系統8:一致化系統 160
7.7傳遞數據以用於展示 160
7.7.1子系統9:漸變維度管理器 161
7.7.2子系統10:代理鍵生成器 164
7.7.3子系統11:層次結構管理器 164
7.7.4子系統12:特殊維度管理器 165
7.7.5子系統13:事實表構建器 166
7.7.6子系統14:代理鍵管道 169
7.7.7子系統15:多值維度橋接表構建器 173
7.7.8子系統16:遲到數據的處理程式 173
7.7.9子系統17:維度管理器 175
7.7.10子系統18:事實提供程式系統 175
7.7.11子系統19:聚合構建器 175
7.7.12子系統20:OLAP多維數據集構建器 176
7.7.13子系統21:數據傳播管理器 176
7.8管理ETL環境 176
7.9小結 178
第8章核心AnalysisServicesOLAP資料庫 181
8.1AnalysisServicesOLAP概述 182
8.1.1使用AnalysisServices的原因 183
8.1.2不使用AnalysisServices的原因 184
8.2設計OLAP結構 185
8.2.1規劃 185
8.2.2起始工作 187
8.2.3創建項目和數據源視圖 188
8.2.4維度設計 190
8.2.5創建和編輯維度 193
8.2.6創建和編輯多維數據集 202
8.3物理設計的考慮因素 215
8.3.1理解存儲模式 216
8.3.2分區計畫 217
8.3.3設計性能聚合 219
8.3.4部署計畫 220
8.3.5處理整個多維數據集 220
8.3.6開發增量處理計畫 221
8.4小結 224
第9章實時商業智慧型的設計需求 227
9.1實時分類 228
9.1.1實時的含義 228
9.1.2需要實時的人員 229
9.1.3對實時的權衡 229
9.2場景和解決方案 231
9.2.1實時地執行報表 232
9.2.2通過快取向報表提供服務 232
9.2.3用鏡像和快照創建ODS 233
9.2.4用複製功能創建ODS 233
9.2.5建立BizTalk應用程式 234
9.2.6建立實時關係分區 234
9.3小結 237
第Ⅲ部分商業智慧型應用程式的開發
第10章在ReportingServices中構建BI應用程式 241
10.1BI應用程式概述 242
10.2商業智慧型應用程式的價值 243
10.3報表設計高層次的體系結構 244
10.3.1回顧報表設計的業務需求 245
10.3.2ReportingServices的體系結構 246
10.3.3使用ReportingServices作為標準的報表設計工具 247
10.3.4ReportingServices的評價 253
10.4報表設計系統的設計和開發過程 253
10.4.1報表設計系統的設計 254
10.4.2報表設計系統的開發 260
10.5報表的構建和傳送 262
10.5.1規劃和準備 262
10.5.2創建報表 264
10.5.3報表設計的運行 275
10.6即席報表設計選項 275
10.6.1報表模型 276
10.6.2共享數據集 277
10.6.3報表部件 277
10.7小結 277
第11章PowerPivot和Excel 279
11.1使用Excel進行分析和報表設計 280
11.2PowerPivot體系結構 281
11.3創建和使用PowerPivot資料庫 283
11.3.1開始使用PowerPivot 283
11.3.2PowerPivot表的設計 284
11.3.3使用PowerPivot創建分析表 286
11.3.4PowerPivotforExcel的觀察和指導原則 291
11.4PowerPivotforSharePoint 291
11.4.1PowerPivotSharePoint用戶體驗 292
11.4.2伺服器級別的資源 294
11.4.3PowerPivot的監控和管理 295
11.5PowerPivot在託管DW/BI環境下的作用 297
11.6小結 297
第12章BI門戶和SharePoint 299
12.1BI門戶 300
12.1.1BI門戶的規劃 300
12.1.2對設計的影響 301
12.1.3業務過程的類別 302
12.1.4額外的功能 302
12.1.5建立BI門戶 303
12.2把SharePoint用作BI門戶 304
12.2.1體系結構和概念 305
12.2.2安裝SharePoint 309
12.2.3安裝測試系統 312
12.2.4完成BI門戶 315
12.2.5BIPortal站點模板的其他功能 315
12.2.6研究SharePoint 316
12.3小結 316
第13章數據挖掘的加入 317
13.1數據挖掘的定義 318
13.1.1基本的數據挖掘術語 319
13.1.2數據挖掘的業務套用 320
13.1.3角色和責任 324
13.2SQLServer數據挖掘體系結構概述 325
13.2.1數據挖掘設計環境 326
13.2.2構建、部署和處理 326
13.2.3挖掘模型的訪問 326
13.2.4IntegrationServices和數據挖掘 327
13.2.5其他功能 327
13.2.6體系結構的總結 328
13.3Microsoft數據挖掘的算法 328
13.3.1決策樹 329
13.3.2Na?veBayes算法 330
13.3.3群集 330
13.3.4順序群集 330
13.3.5時間序列 331
13.3.6關聯 331
13.3.7神經網路 331
13.4數據挖掘的過程 331
13.4.1業務階段 332
13.4.2數據挖掘階段 333
13.4.3操作階段 339
13.4.4元數據 340
13.5數據挖掘的示例 340
13.5.1案例研究:給城市分類 341
13.5.2案例研究:產品推薦 349
13.6小結 362
第Ⅳ部分DW/BI系統的部署和管理
第14章設計和實施安全保護 365
14.1確定安全管理員 366
14.2保護硬體和作業系統 366
14.2.1保護作業系統 366
14.2.2使用Windows集成安全
認證 367
14.3保護開發環境 367
14.4保護數據 368
14.4.1向內部用戶提供開放的訪問 368
14.4.2分條列出敏感數據 370
14.4.3保護各種類型的數據訪問 370
14.5保護DW/BI系統的組件 371
14.5.1ReportingServices安全 371
14.5.2AnalysisServices的安全 373
14.5.3關係DW的安全 381
14.5.4IntegrationServices安全 385
14.6使用情況的監控 386
14.7小結 386
第15章元數據規劃 389
15.1元數據的基礎 389
15.1.1元數據的目標 390
15.1.2元數據種類 390
15.1.3元資料庫 390
15.2元數據標準 391
15.3SQLServer2008R2元數據 392
15.3.1跨工具組件 395
15.3.2關係引擎的元數據 395
15.3.3AnalysisServices 395
15.3.4IntegrationServices 396
15.3.5ReportingServices 396
15.3.6MasterDataServices 397
15.3.7SharePoint 397
15.3.8外部元數據的源 397
15.3.9對SQLServer元數據的期待 397
15.4實用的元數據方法 398
15.4.1元數據策略的創建 398
15.4.2業務元數據報表 399
15.4.3過程元數據報表設計 402
15.4.4技術元數據報表 403
15.4.5過程元數據的管理 403
15.5小結 403
第16章部署 405
16.1建立環境 406
16.2測試 408
16.2.1開發測試 409
16.2.2系統測試 411
16.2.3數據質量保證的測試 413
16.2.4性能測試 414
16.2.5可用性的測試 416
16.2.6測試小結 417
16.3部署到生產環境中 418
16.3.1關係資料庫的部署 418
16.3.2IntegrationServices程式包的部署 420
16.3.3AnalysisServices資料庫的部署 421
16.3.4ReportingServices
報表的部署 422
16.3.5MasterDataServices部署 423
16.4數據倉庫和BI文檔 424
16.4.1核心描述 424
16.4.2其他文檔 425
16.5用戶的培訓 426
16.6用戶支持 428
16.7台式計算機的準備和配置 429
16.8小結 430
第17章運行與維護 431
17.1提供用戶支持 432
17.1.1BI門戶的維護 433
17.1.2BI應用程式的擴展 433
17.2系統管理 434
17.2.1DW/BI系統的控制 434
17.2.2性能的監控 439
17.2.3使用情況的監控 444
17.2.4磁碟空間的管理 445
17.2.5服務和可用性的管理 446
17.2.6DW/BI系統的性能調整 447
17.2.7備份和恢復 448
17.2.8ETL程式包的執行 451
17.3小結 452
第18章目前的需要及未來的展望 453
18.1發展DW/BI系統 453
18.2生命周期和常見的問題回顧 454
18.2.1階段Ⅰ——?需求、現實、
體系結構和設計 455
18.2.2階段Ⅱ——?資料庫的
開發 455
18.2.3階段Ⅲ——?開發BI套用
程式和門戶環境 456
18.2.4階段IV——?DW/BI系統的部署和管理 456
18.2.5疊代和擴展 456
18.3MicrosoftBI工具集中受歡迎的部分 457
18.4未來的方向:改進的空間 457
18.4.1查詢工具 458
18.4.2元數據 458
18.4.3關係資料庫引擎 458
18.4.4AnalysisServices 459
18.4.5MasterDataServices 459
18.4.6集成 459
18.4.7顧客關注點 460
18.5小結 460