實戰Hadoop 2.0（第二版）——從雲計算到大數據

基本簡介

《實戰Hadoop 2.0（第二版）——從雲計算到大數據》是電子工業出版社出版的一本圖書。

內容簡介

書是劉鵬教授主編的國內第一本Hadoop編程書籍《實戰Hadoop》的第二版。Hadoop堪稱業界最經典的開源雲計算和大數據平台軟體。本書系統介紹了Hadoop 2.0生態圈的核心和擴展組件，包括：管理工具Ambari、分散式檔案系統HDFS、分散式資源管理器YARN、分散式並行處理MapReduce、記憶體型計算框架Spark、數據流實時處理系統Storm、分散式鎖服務ZooKeeper、分散式資料庫HBase、數據倉庫工具Hive，以及Pig、Oozie、Flume、Mahout等。

圖書目錄

|第1章| 大數據組件概述 1

1.1 Google大數據組件 2

1.2 Apache大數據組件 6

1.2.1 Hadoop核心組件 7

1.2.2 基於MR的數據分析組件 10

1.2.3 資料庫組件 16

1.2.4 BSP組件 19

1.2.5 基於YARN框架組件 20

1.2.6 基於YARN的編程類庫組件 24

1.2.7 搜尋引擎組件 25

1.2.8 工作流組件 26

1.2.9 數據流組件 27

1.2.10 序列化和持久化組件 29

1.2.11 調試工具 30

1.2.12 安全性組件 31

1.2.13 兼容性組件 33

1.2.14 集群部署與管理組件 33

習題 34

參考文獻 35

|第2章| 大數據集群 39

2.1 大數據集群簡介 40

2.2 大數據集群bigCstor 45

2.3 我的大數據集群littleCstor 48

2.4 小結 52

習題 52

參考文獻 53

|第3章| 集群管理工具Ambari 55

3.1 Ambari簡介 56

3.2 使用Ambari部署HDP 59

3.3 使用Ambari搭建littleCstor 62

3.3.1 相關約定 62

3.3.2 制定部署規劃 63

3.3.3 搭建prelittleCstor 64

3.3.4 本地建倉 72

3.3.5 部署AmbariServer 77

3.3.6 搭建littleCstor 83

3.3.7 小結 105

3.4 使用Ambari管理littleCstor 110

3.5 小結 111

習題 111

參考文獻 111

|第4章| 分散式檔案系統HDFS 113

4.1 分散式存儲引例 114

4.1.1 問題描述 114

實戰Hadoop 2.0（第二版）——從雲計算到大數據

基本介紹

基本簡介

內容簡介

圖書目錄

熱門詞條