Hadoop + Spark生態系統操作與實戰指南

內容簡介

本書用於Hadoop+Spark快速上手，全面解析Hadoop和Spark生態系統，通過原理解說和實例操作每一個組件，讓讀者能夠輕鬆跨入大數據分析與開發的大門。

圖書目錄

第1章Hadoop概述1

1.1Hadoop簡介1

1.2Hadoop版本和生態系統3

1.3MapReduce簡介7

1.4HDFS簡介8

1.5Eclipse+Java開發環境搭建10

1.5.1Java安裝10

1.5.2Maven安裝11

1.5.3Eclipse安裝和配置12

1.5.4Eclipse創建Maven項目16

1.5.5Eclipse其餘配置19

1.6小結21

第2章Hadoop集群搭建22

2.1虛擬機簡介22

2.2虛擬機配置24

2.3Linux系統設定31

2.4Apache版本Hadoop集群搭建36

2.5CDH版本Hadoop集群搭建44

2.5.1安裝前期準備44

2.5.2ClouderaManager安裝45

2.5.3CDH安裝46

2.6小結55

第3章Hadoop基礎與原理56

3.1MapReduce原理介紹56

3.1.1MapReduce的框架介紹56

3.1.2MapReduce的執行步驟58

3.2HDFS原理介紹59

3.2.1HDFS是什麼59

3.2.2HDFS架構介紹59

3.3HDFS實戰62

3.3.1HDFS客戶端的操作62

3.3.2Java操作HDFS65

3.4YARN原理介紹69

3.5小結71

第4章ZooKeeper實戰72

4.1ZooKeeper原理介紹72

4.1.1ZooKeeper基本概念72

4.1.2ZooKeeper工作原理73

4.1.3ZooKeeper工作流程76

4.2ZooKeeper安裝78

4.3ZooKeeper實戰80

4.3.1ZooKeeper客戶端的操作80

4.3.2Java操作ZooKeeper81

4.3.3Scala操作ZooKeeper85

4.4小結87

第5章MapReduce實戰88

5.1前期準備88

5.2查看YARN上的任務95

5.3載入配置檔案95

5.4MapReduce實戰96

Hadoop + Spark生態系統操作與實戰指南

基本介紹

內容簡介

圖書目錄

熱門詞條