數據倉庫生命周期工具箱(第二版)

數據倉庫生命周期工具箱(第二版)

《數據倉庫生命周期工具箱(第二版)》是清華大學出版社出版的圖書,作者是(美)金博爾 等著。

自1998年本書第一版出版以來,經過十多年的發展,數據倉庫行業已經完全成熟,而且軟硬體都有了極大的進步。那一版所提出的方法幾乎已經被所有的數據倉庫廠商和從業人員所採納。現在,RalphKimbatl和其他專家一起對原有的生命周期方法和技巧集進行了改良。在本書中,他們將悉心為您講述設計、開發和部署DW/Bl系統的詳細步驟。這些步驟將教會您如何創建一個具有適應性的系統來為業務用戶提供數據和分析結果,以幫助他們做出更好的商務決策。

基本介紹

  • 書名:數據倉庫生命周期工具箱(第二版)
  • 作者:(美)金博爾 等著
  • 譯者:孫媛媛
  • 出版社:清華大學出版社
圖書信息,圖書目錄,

圖書信息

作 者:(美)金博爾 等著,唐富年,孫媛媛 譯
出 版 社:清華大學出版社
出版時間:2009-9-1
版 次:1
頁 數:472
字 數:754000
印刷時間:2009-9-1
開 本:16開
紙 張:膠版紙
印 次:1
I S B N:9787302203742
包 裝:平裝

圖書目錄

第1章Kimball生命周期導論 1
1.1生命周期的歷史 1
1.2生命周期里程碑 3
1.2.1項目/項目群規劃 3
1.2.2項目/項目群管理 4
1.2.3業務需求定義 4
1.2.4技術路線 4
1.2.5數據路線 5
1.2.6商業智慧型套用路線 6
1.2.7部署 6
1.2.8維護 6
1.2.9增長 6
1.3使用生命周期圖 7
1.4生命周期導航幫助 7
1.5生命周期相關術語簡介 8
1.5.1數據倉庫與商業智慧型 8
1.5.2ETL系統 9
1.5.3業務過程維度模型 9
1.5.4商業智慧型應用程式 10
1.6小結 11
第2章項目/項目群的啟動與管理 13
2.1確定項目 14
2.1.1評估DW/BI項目的準備
就緒情況 14
2.1.2彌補不足並確定下步工作 15
2.1.3確定初步範圍和章程 18
2.1.4建立商業報告和合理性
證明 22
2.2項目規劃 26
2.2.1確立項目標識 26
2.2.2項目人員配備 26
2.2.3制定項目計畫 32
2.2.4制定溝通計畫 35
2.3項目管理 37
2.3.1召開項目團隊啟動會議 38
2.3.2監控項目狀態 39
2.3.3維護項目計畫 40
2.3.4整理項目文檔 40
2.3.5範圍管理 40
2.3.6期望管理 42
2.3.7辨識項目陷入困境的徵兆 42
2.4項目群管理 43
2.4.1確立管理職責和管理過程 43
2.4.2將數據管理員的地位
提升到企業層 44
2.4.3利用高效的方法和
架構最優方法 45
2.4.4進行定期評估 45
2.4.5溝通,溝通,溝通 46
2.5小結 46
2.6管理工作和降低風險 46
2.7質量保證 46
2.8關鍵角色 47
2.9關鍵提交內容 47
2.10作量估計 47
2.11站資源 48
2.12任務列表 48
第3章收集業務需求 51
3.1需求定義的各種方法 53
3.1.1個別訪談VS集體
促談會 53
3.1.2收集業務需求應避免
使用的方法 54
3.2訪談準備 55
3.2.1確定訪談小組 55
3.2.2研究業務機構 56
3.2.3選擇受訪者 57
3.2.4設計訪談問卷 58
3.2.5確定訪談時間表 60
3.2.6通知受訪者做好準備 61
3.2.7訪談中的基本規則綜述 63
3.3進行訪談 65
3.3.1項目群層面的業務訪談 66
3.3.2項目群層面上的IT訪談 67
3.3.3項目群合規性/安全性訪談 67
3.4總結訪談 67
3.4.1確定項目群成功的標準 67
3.4.2致謝並告辭 68
3.5審查訪談結果 69
3.6準備和發布項目群需求文檔 70
3.6.1訪談書面說明 70
3.6.2項目群需求調查結果文檔 71
3.7區分業務優先次序和
商定下步工作 73
3.7.1以優先權的審查和
確定結束會議 73
3.7.2結束本輪訪談 74
3.8項目層需求的調整 75
3.8.1走近項目層 75
3.8.2為項目需求訪談做準備 76
3.8.3進行訪談 77
3.8.4深入調查數據 79
3.8.5審查訪談結果 79
3.8.6準備和發布項目提交材料 80
3.8.7協商下一步工作並結束
本輪訪談 80
3.9應對富有挑戰性的受訪者 80
3.9.1受過打擊的用戶 81
3.9.2超負荷的用戶/替換用戶 81
3.9.3昏昏欲睡的用戶 81
3.9.4過分熱心的用戶 81
3.9.5自以為無所不知的用戶 82
3.9.6一竅不通的用戶 82
3.9.7用戶的缺位 82
3.10小結 82
3.11管理工作和降低風險 83
3.12保證質量 83
3.13關鍵角色 83
3.14關鍵提交內容 84
3.15工作量估計 84
3.16網站資源 84
3.17任務列表 85
第4章技術架構介紹 87
4.1架構的價值 88
4.2技術架構綜述 89
4.2.1從源系統到用戶桌面
的流程 91
4.2.2常見架構特徵 91
4.2.3DW/BI架構評估 94
4.3後台架構 94
4.3.1ETL一般性需求 95
4.3.2創建與購買 95
4.3.3後台ETL流程 95
4.3.4源系統 97
4.3.5抽取 100
4.3.6清洗和一致化 100
4.3.7提交 101
4.3.8ETL管理服務 101
4.3.9其他後台服務和趨勢 102
4.3.10ETL數據存儲 102
4.3.11ETL元數據 103
4.3.12後台總結 104
4.4呈現伺服器架構 105
4.4.1信息方面的業務需求 105
4.4.2細節原子數據 106
4.4.3聚集 106
4.4.4呈現伺服器設計規定 108
4.4.5調整呈現伺服器架構 109
4.4.6機構考慮事項 109
4.4.7呈現伺服器元數據 110
4.4.8呈現伺服器總結 110
4.5前台架構 111
4.5.1BI應用程式類型 112
4.5.2BI管理服務 112
4.5.3BI數據存儲 118
4.5.4桌面工具架構方法 120
4.5.5BI元數據 120
4.5.6前台總結 121
4.6底層設施 121
4.6.1底層設施驅動因素 122
4.6.2後台和呈現伺服器底
層設施因素 122
4.6.3並行處理硬體架構 124
4.6.4硬體性能推進器 127
4.6.5資料庫平台因素 128
4.6.6前台底層設施要素 130
4.6.7底層設施總結 132
4.8元數據 132
4.8.1元數據集成的價值 132
4.8.2元數據集成的供選方案 133
4.8.3元數據總結 134
4.9安全性 134
4.9.1安全方面的弱點 135
4.9.2安全性總結 137
4.10小結 137
第5章創建架構計畫和選擇產品 139
5.1創建架構 139
5.1.1架構開發過程 140
5.1.2設計應用程式架構計畫 142
5.2選擇產品 149
5.2.1保留一個業務關注點 149
5.2.2主要DW/BI評估領域 149
5.2.3評估供選方案並挑選產品 150
5.2.4後台和呈現伺服器方
面的考慮事項 158
5.2.5前台考慮事項 160
5.2.6管理元數據 161
5.2.7任命元數據管理員 162
5.2.8創建元數據策略 162
5.3保護系統安全 163
5.3.1保護硬體和作業系統
的安全 164
5.3.2保護開發環境的安全 164
5.3.3保護網路安全 165
5.3.4用戶驗證 167
5.3.5數據保護 168
5.3.6監視使用情況和保證
合規性 171
5.3.7備份和恢復計畫 171
5.3.8創建底層設施圖 172
5.4安裝硬體和軟體 174
5.5小結 175
5.6管理工作和降低風險 175
5.7質量保證 176
5.8關鍵角色 176
5.9關鍵提交內容 177
5.10工作量估計 177
5.10.1創建架構計畫 177
5.10.2選擇產品 177
5.10.3元數據 177
5.10.4安全性 178
5.11網站資源 178
5.12任務列表 178
第6章維度建模介紹 183
6.1使用維度建模的場合 184
6.1.1什麼是維度建模 184
6.1.2怎樣進行規範化建模? 185
6.1.3維度建模的好處 186
6.2維度建模入門 187
6.2.1事實表 187
6.2.2維度表 189
6.2.3四步維度設計過程 193
6.3企業數據倉庫匯流排架構 194
6.3.1規劃危機 194
6.3.2匯流排架構 195
6.3.3價值鏈的意義 196
6.3.4通用矩陣的常見問題 197
6.3.5堅持使用一致性維度 198
6.4對維度的深入討論 198
6.4.1日期和時間 199
6.4.2退化維 201
6.4.3緩慢變化維 202
6.4.4角色扮演維 205
6.4.5雜項維 206
6.4.6雪花型和支架 208
6.4.7處理層次結構 211
6.4.8使用橋接表的多值維 212
6.5更多關於事實的討論 214
6.5.1三個基本粒度 215
6.5.2不同粒度的事實及其分配 217
6.5.3多種貨幣和度量單位 219
6.5.4無事實的事實表 221
6.5.5合併事實表 221
6.6有關維度建模的錯覺和誤區 222
6.6.1將關注點集中在部門報表
上導致的錯誤觀點 222
6.6.2提前匯總導致的錯誤觀點 223
6.6.3過於重視規範化導致
的錯誤觀點 224
6.7小結 225
第7章維度模型設計 227
7.1建模過程綜述 227
7.2組建團隊 229
7.2.1確定參加設計的人員 229
7.2.2回顧需求 231
7.2.3使用建模工具 231
7.2.4確立命名約定 233
7.2.5為源數據調查和數據
探查做準備 234
7.2.6獲取場所和用品 234
7.3再論四步建模過程 234
7.3.1第1步:選擇業務過程 235
7.3.2第2步:聲明粒度 235
7.3.3第3步:識別維度 236
7.3.4第4步:識別事實 237
7.4設計維度模型 237
7.4.1建立高層維度模型 238
7.4.2開發詳細的維度模型 240
7.4.3審查和驗證模型 250
7.4.4設計文檔定稿 251
7.5擁抱數據管理 252
7.6小結 253
7.7管理工作和降低風險 253
7.8保證質量 254
7.9關鍵角色 254
7.10關鍵提交內容 254
7.11工作量估計 255
7.12網站資源 255
7.13任務列表 255
第8章物理資料庫設計與性能規劃 257
8.1制定標準 258
8.1.1遵守命名約定 259
8.1.2為空還是不為空 259
8.1.3設定登台表 259
8.1.4制定檔案位置標準 260
8.1.5對用戶訪問的表使用
代用名或者視圖 260
8.1.6主鍵 261
8.1.7外鍵 262
8.2設計物理數據模型 263
8.2.1設計物理數據結構 263
8.2.2確定源到目標的映射 264
8.2.3星型VS雪花型 265
8.2.4使用數據建模工具 266
8.2.5進行初步的規模估計 267
8.3創建開發資料庫 268
8.4設計處理數據存儲 269
8.5設計初始索引方案 270
8.5.1索引和查詢策略綜述 270
8.5.2為維度表建立索引 272
8.5.3為事實表建立索引 272
8.5.4為裝載數據(loads)
建立索引 273
8.5.5為OLAP建立索引 273
8.5.6在裝載之後分析表和索引 273
8.6設計OLAP資料庫 274
8.6.1OLAP數據粒度和
深入鑽取 274
8.6.2完善OLAP維度 274
8.6.3定義OLAP計算 275
8.7建立測試資料庫 276
8.8設計聚集 276
8.8.1確定如何聚集 276
8.8.2確定聚集的內容 277
8.8.3維護聚集 278
8.8.4完成索引 279
8.9設計和構建資料庫實例 279
8.9.1記憶體 280
8.9.2塊大小 280
8.9.3保存資料庫構建腳本
和參數檔案 280
8.10設計物理存儲結構 281
8.10.1計算表和索引的大小 281
8.10.2設計分區方案 281
8.10.3設定存儲 282
8.11小結 284
8.12管理工作和降低風險 284
8.13保證質量 285
8.14關鍵角色 285
8.15關鍵提交內容 285
8.16工作量估計 285
8.17網站資源 286
8.18任務列表 286
第9章抽取、轉換和裝載介紹 289
9.1歸攏需求 290
9.1.1業務需求 290
9.1.2合規性 290
9.1.3數據質量 291
9.1.4安全性 291
9.1.5數據集成 291
9.1.6數據等待時間 292
9.1.7存檔和沿襲 292
9.1.8用戶提交界面 292
9.1.9可用的技能 292
9.1.10遺留許可證 293
9.2ETL系統的34個子系統 293
9.3抽取數據 293
9.3.1子系統1——數據探查 294
9.3.2子系統2——變化數據
捕捉系統 294
9.3.3子系統3——抽取系統 296
9.4數據的清洗和一致化 297
9.4.1改進數據質量文化和過程 297
9.4.2子系統4——數據清洗
系統 298
9.4.3子系統5——錯誤事件
模式 299
9.4.4子系統6——審計維裝
配器 300
9.4.5子系統7——重複數據
刪除系統 301
9.4.6子系統8——一致化系統 302
9.5向呈現層交付數據 303
9.5.1子系統9——緩慢變化
維管理器 303
9.5.2子系統10——代理鍵
生成器 306
9.5.3子系統11——層次管
理器 306
9.5.4子系統12——專用維
度管理器 307
9.5.5子系統13——事實表
構建器 308
9.5.6子系統14——代理鍵
管道 310
9.5.7子系統15——多值維
度橋接表構建器 311
9.5.8子系統16——延遲到
達數據處理器 312
9.5.9子系統17——維度管
理系統 312
9.5.10子系統18——事實提
供系統 313
9.5.11子系統19——聚集構
建器 313
9.5.12子系統20——OLAP多
維數據集構建器 314
9.5.13子系統21——數據傳
播管理器 314
9.6管理ETL環境 315
9.6.1子系統22——作業
調度器 315
9.6.2子系統23——備份
系統 316
9.6.3子系統24——恢復和
重啟系統 317
9.6.4子系統25——版本
控制系統 318
9.6.5子系統26——版本
遷移系統 318
9.6.6子系統27——工作流
監視器 319
9.6.7子系統28——排序
系統 320
9.6.8子系統29——沿襲和
依賴分析器 320
9.6.9子系統30——問題
自動調整系統 321
9.6.10子系統31——並行
/管道系統 321
9.6.11子系統32——安全
系統 322
9.6.12子系統33——合規性
管理器 322
9.6.13子系統34——元數據
知識庫管理器 323
9.7實時的意義 323
9.7.1實時的分類 323
9.7.2實時的權衡 325
9.7.3呈現伺服器上的實時分區 326
9.8小結 327
第10章設計和開發ETL系統 329
10.1ETL過程綜述 329
10.2啟動 330
10.3設計ETL計畫 331
10.3.1步驟1——制訂高層
計畫 331
10.3.2步驟2——選擇ETL
工具 332
10.3.3步驟3——制定默認
策略 333
10.3.4步驟4——由目標表向下
鑽取 334
10.3.5設計ETL說明文檔 336
10.3.6開發沙盒源系統 337
10.4設計一次性的歷史裝載
處理 338
10.4.1步驟5——使用歷史數據
填充維度表 339
10.4.2步驟6——執行事實表
歷史裝載 346
10.5設計增量ETL處理過程 352
10.5.1步驟7——維度表增量
處理 352
10.5.2步驟8——事實表增量
處理 355
10.5.3步驟9——聚集表和OLAP
裝載 359
10.5.4步驟10——ETL系統操作
和自動化 360
10.6小結 362
10.7管理工作和降低風險 362
10.8保證質量 363
10.9關鍵角色 363
10.10關鍵交付內容 363
10.11工作量估計 363
10.12網站資源 364
10.13任務列表 364
第11章商務智慧型應用程式介紹 367
11.1商業智慧型應用程式的重
要性 367
11.2商業智慧型分析周期 369
11.2.1第一階段:監視活動 370
11.2.2第二階段:識別異常 370
11.2.3第三階段:確定構成原因
的因素 370
11.2.4第四階段:模型供選
方案 371
11.2.5第五階段:採取行動並
跟蹤結果 371
11.2.6分析周期的更多意義 371
11.3商業智慧型應用程式的類型 372
11.3.1直接訪問查詢和報表
工具 372
11.3.2標準報表 377
11.3.3分析性應用程式 378
11.3.4儀錶板和記分卡 379
11.3.5運營商業智慧型 381
11.3.6數據挖掘 382
11.4通過BI門戶導航套用
程式 385
11.4.1考慮密度 387
11.4.2基於業務過程的導航
結構 387
11.4.3附加門戶功能 388
11.4.4應用程式界面供選
方案 389
11.5小結 389
第12章設計和開發商務智慧型套用
程式 391
12.1商業智慧型應用程式資源
規劃 392
12.1.1BI應用程式開發人員
的角色 392
12.1.2誰來完成商業智慧型
工作 392
12.1.3生命周期時間安排 392
12.2BI應用程式規範 393
12.2.1創建應用程式標準和
模板 393
12.2.2確定初始應用程式集 396
12.2.3制定詳細的應用程式
規範 398
12.2.4設計導航框架和門戶 401
12.2.5審查以及確認應用程式
和模型 402
12.2.6與業務人士一同審查 403
12.3BI應用程式開發 403
12.3.1準備應用程式開發 403
12.3.2構建應用程式 405
12.3.3應用程式和數據的測試
和驗證 411
12.3.4完成文檔 412
12.3.5部署計畫 412
12.4BI應用程式維護 412
12.5小結 413
12.6管理工作並降低風險 413
12.7保證質量 413
12.8關鍵角色 414
12.9關鍵提交內容 414
12.10工作量估計 414
12.10.1BI應用程式規範 415
12.10.2開發 415
12.11網站資源 415
12.12任務列表 415
第13章DW/BI系統的部署和
支持 419
13.1系統部署 420
13.1.1部署前測試 420
13.1.2部署 428
13.2文檔和培訓 431
13.2.1核心文檔 431
13.2.2補充文檔 432
13.2.3用戶培訓 433
13.3維護與支持 435
13.3.1管理前台 436
13.3.2管理後台 439
13.4小結 443
13.5管理工作和降低風險 443
13.6質量保證 444
13.7關鍵角色 444
13.8關鍵提交內容 444
13.9工作量估計 444
13.10任務列表 445
第14章擴展DW/BI系統 449
14.1對已有環境的管理 449
14.1.1贏得業務用戶 450
14.1.2向上管理 450
14.1.3度量並推銷您的成功 451
14.1.4經常進行溝通 453
14.2為增長與演化作準備 454
14.2.1評估當前環境 454
14.2.2最佳化增長時機 455
14.2.3管理疊代增長 456
14.3小結 457
14.4管理工作和降低風險 457
14.5保證質量 458
14.6關鍵角色 458
14.7關鍵提交內容 458
14.8工作量估計 458
術語表 459

熱門詞條

聯絡我們