Hadoop 3.x大數據開發實戰（視頻教學版）

內容簡介

本書以Hadoop 3.x及其周框線架為主線，介紹了整個Hadoop生態系統主流的大數據開發技術。全書共16章，第1章講解VMware中CentOS 7作業系統的安裝；第2章講解作業系統集群環境的配置；第3~16章講解Hadoop生態系統各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和數據實時處理系統Flume、Kafka、Storm、Spark以及分散式搜尋系統Elasticsearch等的基礎知識、架構原理、集群環境搭建，同時包括常用的Shell命令、API操作、源碼剖析，並通過案例演示了各個框架的實際套用。讀者即使沒有任何大數據基礎，通過閱讀本書，也可以對照書中的步驟成功搭建屬於自己的大數據集群並獨立完成項目開發。本書通俗易懂，內容豐富，適合大數據開發初學者、大數據運維人員以及大數據分析與挖掘的從業者閱讀

圖書目錄

第1章 VMware中安裝CentOS 1

1.1 下載CentOS 7鏡像檔案 1

1.2 新建虛擬機 4

1.3 安裝作業系統 6

1.4 動手練習 11

第2章 CentOS 7集群環境配置 12

2.1 系統環境配置 12

2.1.1 新建用戶 12

2.1.2 修改用戶許可權 13

2.1.3 關閉防火牆 13

2.1.4 設定固定IP 13

2.1.5 修改主機名 16

2.1.6 新建資源目錄 17

2.2 安裝JDK 17

2.3 克隆虛擬機 18

2.4 配置主機IP映射 20

2.5 動手練習 21

第3章 Hadoop 22

3.1 Hadoop簡介 22

3.1.1 Hadoop生態系統架構 22

3.1.2 Hadoop不同版本架構對比 24

3.2 YARN基本架構及組件 25

3.3 YARN工作流程 27

3.4 配置集群各節點SSH無密鑰登錄 28

3.4.1 無密鑰登錄原理 28

3.4.2 無密鑰登錄操作步驟 29

3.5 搭建Hadoop 3.x分散式集群 31

3.6 動手練習 37

第4章 HDFS 38

4.1 HDFS簡介 38

4.1.1 設計目標 38

4.1.2 總體架構 39

4.1.3 主要組件 40

4.1.4 檔案讀寫 42

4.2 HDFS命令行操作 43

4.3 HDFS Web界面操作 46

4.4 HDFS Java API操作 48

Hadoop 3.x大數據開發實戰（視頻教學版）

基本介紹

內容簡介

圖書目錄

熱門詞條