《大數據架構師指南》是一部由朱進雲,陳堅,王德政所編著的書籍, 清華大學出版社出版發行。
基本介紹
- 書名:大數據架構師指南
- 作者:朱進雲,陳堅,王德政
- ISBN:9787302435167
- 出版社: 清華大學出版社
出版信息,內容簡介,目錄,
出版信息
- 出版社:清華大學出版社
- ISBN:9787302435167
- 版次:1
- 商品編碼:12354111
- 包裝:平裝
- 開本:16
- 出版時間:2016-05-01
- 用紙:膠版紙
- 頁數:296
- 字數:320000
內容簡介
本書的目的就是為了幫助讀者在最短的時間內,系統地把握大數據相關的技術框架,建立系統架構級別的技術思考能力與原則。本書適用於企業的IT與大數據的從業人員,IT與大數據相關的銷售人員,企業的首席技術官(CTO)、首席信息官(CIO),由於本書在大數據知識具備系統性,也可以作為高校大數據方面課程的教材或輔導書。
目錄
第一部分 大數據架構師入門
第1章 大數據概述 3
1.1 什麼是大數據 4
1.2 大數據的本質 6
1.3 大數據技術當前狀態 8
1.4 大數據的技術發展趨勢 11
第2章 大數據項目常見場景 13
2.1 實驗型部署場景 14
2.2 中小型部署場景 16
2.3 大型部署場景 19
第3章 大數據方案關鍵因素 23
3.1 數據存儲規模與數據類型 24
3.2 數據來源與數據質量 25
3.3 業務特徵 26
3.4 經濟可行性 27
3.5 運維管理要求 28
3.6 安全性要求 29
3.7 部署要求 31
3.8 系統邊界 32
3.9 約束條件 34
3.10 要點回顧 34
第二部分 大數據架構師基礎
第4章 Hadoop基礎組件 39
4.1 Hadoop簡介 40
4.2 Hadoop版本演進 41
4.3 Hadoop2.0生態系統簡介 42
4.4 Hadoop分散式檔案系統HDFS 43
4.5 Hadoop統一資源管理框架YARN 48
4.6 Hadoop分散式計算框架MapReduce 52
4.7 Hadoop分散式集群管理系統ZooKeeper 57
第5章 Hadoop其他常用組件 61
5.1 Hadoop數據倉庫工具Hive 62
5.2 Hadoop分散式資料庫 HBase 65
5.3 Hadoop實時流處理引擎 Storm 70
5.4 Hadoop互動式查詢引擎 Impala 74
5.5 其他常用組件 78
第6章 Spark記憶體計算框架 83
6.1 記憶體計算與Spark 84
6.2 Spark的主要概念 86
6.3 Spark核心組件介紹 96
6.4 Spark與Hadoop之間的關係 100
6.5 要點回顧 104
第7章大數據中間件層 105
7.1 中間件層簡介 106
7.2 中間件層產品介紹 107
7.3 中間件層的套用 121
7.4 中間件層的發展 124
7.5 要點回顧 128
第8章大數據分析 129
8.1 數據時代 131
8.2 先進分析 133
8.3 架構與平台 136
8.4 數據分析流程 140
8.5 要點回顧 143
第9章可視化技術 145
9.1 可視化技術引言 146
9.2 什麼是數據可視化 147
9.3 數據可視化設計 151
9.4 數據可視化的發展趨勢 160
9.5 要點回顧 161
第10章大數據安全 163
10.1 安全體系 164
10.2 大數據系統安全 168
10.3 要點回顧 180
第11章大數據管理 181
11.1 數據管理的範圍和定義 182
11.2 開源軟體的管理能力 183
11.3 國內主流管理 187
11.4 大數據管理展望 195
11.5 要點回顧 195
第三部分大數據架構師實踐
第12章大數據項目實踐 199
12.1 大數據項目架構關鍵步驟 201
12.2 架構師實踐思考 213
第13章大數據部署實踐 217
13.2 DAP平台特點 219
13.3 某銀行成功案例 220
第四部分 大數據架構師拓展
第14章分散式系統與大數據的關係 229
14.1 分散式系統概述 230
14.2 分散式系統關鍵協定和算法概述 237
14.3 分散式系統和大數據 241
第 15 章資料庫系統與大數據的關係 245
15.1 資料庫系統的歷史 246
15.2 各類系統求同存異 258
15.3 大數據的發展展望 259
第16章雲計算與大數據的關係 261
16.1 虛擬化概述 262
16.2 OpenStack雲管理架構實現 267
16.3 大數據基於雲計算IAAS部署的探討 274
後記 277