數據倉庫套用指南(數據倉庫套用指南:數據倉庫與商務智慧型最佳實踐)

數據倉庫套用指南

數據倉庫套用指南:數據倉庫與商務智慧型最佳實踐一般指本詞條

《數據倉庫套用指南》是2012年機械工業出版社華章公司出版的圖書,作者是Robert Laberge。

基本介紹

  • 作者:Robert Laberge
  • 譯者:祝洪凱                       /            李妹芳
  • ISBN:9787111370444
  • 頁數:316
  • 定價:69.00元
  • 出版社:機械工業出版社華章公司
  • 出版時間:2012-3-24
  • 副標題:數據倉庫與商務智慧型最佳實踐
內容介紹,作者介紹,作品目錄,

內容介紹

本書全面系統地講解如何規劃、設計、構建和管理數據倉庫/商務智慧型解決方案。介紹在數據倉庫開發項目中如何激勵用戶,在整個企業範圍內更好地驅動決策制定,從專業的開發和培訓人員獲取詳細的指導和最佳實踐經驗。本書內容涉及如何選擇恰當的組件、構建企業數據模型、配置數據集市和數據倉庫、構建數據流並降低風險,還涉及項目開發中變更管理、數據監理和安全方面的問題。
主要內容:
· 理解BI和數據倉庫系統組件
· 建立項目目標並有效制定部署計畫
· 用數據挖掘發現組織內業務見解
· 使用ETL技術對數據進行輸入、清洗和規範化
· 使用結構化輸入檔案來定義數據需求
· 使用自上而下、自下而上、混合的設計方式
· 使用數據監理工具來處理安全和性能最佳化問題

作者介紹

Robert (Bob) Laberge是多家網際網路企業的創始人、IBM產業模式和資產實驗室的首席顧問,他的研究重點是數據倉庫和商務智慧型解決方案。
Bob早在20世紀70年代末就開始其職業生涯,當時比爾·蓋茨還只是一個百萬富翁,Bob曾經是開發人員、資料庫管理員、數據建模師、項目經理、數據架構師、企業信息架構師、數據倉庫/商務智慧型審計員、戰略師,而且還是富於創新的企業家。從那時,Bob就跑遍全球,通過設計、最佳化、最佳實踐和在概念層、邏輯層和物理層的常識說明,提供指導、培訓和證明數據倉庫和商務智慧型實踐經驗和解決方案。Bob成功地幫助了50多家大型企業擴展業務,這些企業涉及零售、保險、醫療、鐵路、電信、電子商務和銀行等行業。
Bob擁有英國Durham大學的工商管理碩士學位。

作品目錄

譯者序
前言
作者簡介
第一部分 準備
第1章 數據倉庫和商務智慧型概述
1.1 商務智慧型概述
1.1.1 定義
1.1.2 商務智慧型的價值
1.1.3 剖析商務智慧型
1.1.4 商務智慧型的成功要素
1.1.5 商務智慧型的目標
1.1.6 BI用戶展現層
1.1.7 BI工具和架構
1.1.8 全球化帶來的發展
1.2 數據倉庫概述
1.2.1 定義
1.2.2 數據倉庫系統
1.2.3 數據倉庫架構
1.2.4 數據流術語
1.2.5 數據倉庫目標
1.2.6 數據結構化策略
1.2.7 數據倉庫業務
1.3 常見問題
1.3.1 當前系統是否足夠好
1.3.2 數據倉庫的價值
1.3.3 成本多高
1.3.4 時間多長
1.3.5 成功的因素
第2章 企業中的數據
2.1 企業資產
2.1.1 具有上下文的數據
2.1.2 數據質量
2.1.3 數據字典
2.1.4 數據組件
2.2 組織數據
2.2.1 對數據結構化
2.2.2 數據模型
2.2.3 數據架構
2.3 競爭優勢
2.3.1 構建還是購買數據模型
2.3.2 指導業務
第3章 為什麼創建數據倉庫
3.1 平台遷移
3.1.1 業務連續性
3.1.2 逆向工程
3.1.3 數據質量
3.1.4 並行環境
3.1.5 附加值
3.2 數據倉庫集中化
3.2.1 企業間併購
3.2.2 企業內合併
3.2.3 集中式設計和局部使用
3.3 數據集市整合
3.4 新方案
3.5 新方案:動態報表
3.6 “Just Build It”模式
3.7 數據Floundation
3.8 不構建數據倉庫的原因
3.8.1 數據質量差
3.8.2 缺乏商業目標
3.8.3 缺乏管理層支持
3.8.4 目標不明確
3.8.5 當前系統足夠用
3.8.6 缺乏人才資源
3.8.7 環境不穩定
3.8.8 成本太高
3.8.9 管理不善
第4章 數據倉庫和商務智慧型戰略
4.1 商務智慧型戰略
4.1.1 商業目標
4.1.2 商業用途
4.1.3 架構概覽
4.2 數據倉庫戰略
4.2.1 用途
4.2.2 數據倉庫架構
4.3 重點和成功
4.3.1 整個企業還是業務線
4.3.2 目標明確
4.3.3 成功:衡量的標準是什麼
4.4 從何處著手
4.4.1 關於商務智慧型
4.4.2 關於數據倉庫
4.5 如何開始
4.5.1 關於商務智慧型
4.5.2 關於數據倉庫
4.6 項目階段化
4.7 需要多長時間(重新回顧)
4.8 興趣點
4.8.1 常見的失敗原因
4.8.2 基本原則
第5章 項目資源:角色和洞察力
5.1 關鍵點
5.1.1 項目團隊
5.1.2 資深專業知識
5.1.3 領導力
5.1.4 項目發起人
5.1.5 數據倉庫管理層
5.2 團隊結構
5.2.1 管理層發起人
5.2.2 數據管家
5.2.3 基本資源
5.3 定期審查:進度審核
5.4 能力中心
第6章 項目總結概論
6.1 項目章程
6.2 項目範疇
6.3 工作說明書
第二部分 組件
第7章 商務智慧型:數據集市及其使用方式
7.1 為什麼要對數據建模
7.1.1 數據模型的類型
7.1.2 數據設計
7.2 事實表
7.2.1 事實的類型
7.2.2 事實表的類型
7.2.3 衡量指標來源
7.2.4 事實表關鍵字
7.2.5 事實表粒度
7.2.6 事實表密度
7.2.7 無事實的事實表
7.3 維度表
7.3.1 維度還是指標
7.3.2 歷史表和日期表
7.3.3 維度表關鍵字
7.3.4 維度表的粒度
7.3.5 維度屬性的來源和價值
7.3.6 維度類型
7.3.7 級別和輔助表
7.3.8 個人信息表
7.3.9 維度數
7.4 規模
第8章 企業數據模型
8.1 數據模型概覽
8.2 構建企業數據模型的目標
8.3 企業數據模型的好處
8.4 數據模型:從何處開始
8.5 完全自上而下的數據模型
8.5.1 主題領域模型
8.5.2 概念模型
8.5.3 實體關係模型
8.6 匯流排結構
8.7 購買的數據模型
8.8 模型分析
8.8.1 數據組件
8.8.2 范化數據模型
8.8.3 超類和子類模型
8.8.4 在范化的數據模型中收集歷史信息
8.8.5 代理鍵
8.8.6 邏輯和物理數據模型
8.8.7 是否具備參照完整性
8.9 其他數據模型
8.9.1 輸入數據模型
8.9.2 臨時存儲數據模型
8.10 最後的思考
第9章 數據倉庫架構:組件
9.1 架構概述
9.2 架構師角色
9.2.1 解決方案架構師
9.2.2 數據倉庫架構師
9.2.3 技術架構師
9.2.4 數據架構師
9.2.5 ETL架構師
9.2.6 BI架構師
9.2.7 綜合
9.3 體系結構分層
9.3.1 單層體系結構
9.3.2 經典的兩層體系結構
9.3.3 高級的三層體系結構
9.4 數據倉庫架構
9.4.1 單獨的數據集市架構
9.4.2 匯流排結構
9.4.3 中央存儲庫架構
9.4.4 聯合架構
9.5 組件(分層)
9.5.1 數據源
9.5.2 數據生成
9.5.3 數據組織
9.5.4 數據分發
9.5.5 信息輸出
9.6 實現方式
9.6.1 數據設計和數據流
9.6.2 邏輯和物理模型
9.6.3 自上而下的方式
9.6.4 自下而上的方式
9.6.5 混合模式
9.7 捷徑
9.7.1 數據採集層
9.7.2 中央數據層
9.7.3 數據分發層
9.7.4 表現層
9.7.5 用戶展現層
9.7.6 方法論
9.7.7 現成的解決方案
第10章 ETL和數據質量
10.1 架構
10.1.1 數據獲取
10.1.2 數據分發
10.1.3 ETL映射
10.1.4 初始載入和增量載入
10.1.5 ETL、ELT和ETTL
10.1.6 並行操作
10.1.7 ETL功能角色
10.1.8 數據流圖
10.1.9 業務數據存儲系統
10.2 數據源系統
10.2.1 沒有數據源
10.2.2 多個數據源
10.2.3 其他來源(結構化輸入檔案)
10.2.4 非結構化數據
10.3 數據剖析
10.4 數據獲取
10.4.1 多個大檔案
10.4.2 偽檔案
10.4.3 故障預防策略
10.5 轉換和臨時數據存儲
10.5.1 準備工作
10.5.2 代理鍵
10.5.3 參照完整性
10.5.4 聚合、分析和匯總
10.5.5 編碼表
10.6 載入
10.6.1 是否載入歷史數據
10.6.2 插入、更新、插入或更新、刪除
10.6.3 數據獲取信息
10.6.4 載入調度
10.7 企業數據倉庫的臨時數據存儲和匯流排架構的臨時數據存儲
10.8 數據分發
10.9 數據質量
10.10 ETL工具
第11章 項目規劃和方法論
11.1 基礎
11.1.1 風險:逐步發展
11.1.2 風險:數據質量
11.1.3 風險:資源
11.1.4 風險:成本
11.1.5 變更管理
11.1.6 最佳實踐
11.2 錯誤
11.3 項目規劃方法論
11.3.1 業務需求分析
11.3.2 戰略和規劃
11.3.3 解決方案綱要
11.3.4 設計
11.3.5 構建
11.3.6 部署
11.3.7 使用
第三部分 構建
第12章 工作場景
12.1 讓我們開始“烹飪”吧
12.2 自上而下
12.2.1 字典
12.2.2 集中式數據模型
12.2.3 數據架構
12.2.4 數據源
12.2.5 數據模型
12.2.6 資料庫
12.2.7 數據獲取
12.2.8 解決方案概述
12.3 自下而上
12.3.1 最終結果
12.3.2 字典
12.3.3 數據架構
12.3.4 一致性維度的管理
12.3.5 數據源
12.3.6 解決方案概述
12.4 混合式
12.4.1 起步工作
12.4.2 數據模型
12.4.3 數據架構
12.4.4 解決方案概述
12.5 歸併
12.6 沒有輸入:結構化的輸入檔案
12.7 集成的第二階段
12.8 更大的框架:企業信息架構
第13章 數據監理
13.1 什麼是數據監理
13.2 數據監理的原因
13.3 企業結構
13.4 驅動和啟動
13.5 數據監理的主要方面
13.5.1 安全性和敏感性
13.5.2 數據質量
13.5.3 所有權
13.5.4 變更控制
13.6 數據監理的準備工作
第14章 項目後評審
14.1 概述
14.2 項目評審
14.3 後續工作

相關詞條

熱門詞條

聯絡我們