自己動手做大數據系統（第2版）

內容簡介

《自己動手做大數據系統（第2版）》以離線大數據和流式大數據兩個具體示例，貫穿本書的第二、三部分內容，對組件之間的協同工作關係進行剖析。

第一部分　大數據概述

第1章　大數據的時代背景及套用落地2

1.1　大數據與“雲大物區智”的關聯 2

1.2　大數據平台的套用優勢 4

1.3　大數據平台的技術架構選型和產品對比 4

第2章　大數據系統的安裝及配置7

2.1　伺服器及作業系統的準備 7

2.2　JDK、Python和Scala 8

2.3　Hadoop 12

2.3.1 安裝環境的確認及檔案準備 16

2.3.2 配置環境變數及無密碼傳輸 16

2.3.3 配置Hadoop的對應參數 18

2.3.4 啟動並驗證Hadoop 20

2.4　Sqoop 20

2.4.1 Sqoop安裝檔案的準備 22

2.4.2 Sqoop的安裝及配置 23

2.4.3 Sqoop運行驗證 24

2.5　Hive 25

2.5.1 安裝檔案的準備 26

2.5.2 配置環境變數和安裝MySQL 26

2.5.3 配置Hive參數 26

2.5.4 驗證Hive的相關服務 29

2.6　ZooKeeper和HBase 29

2.6.1 ZooKeeper安裝檔案的準備 30

2.6.2 ZooKeeper的安裝及配置 30

2.6.3 ZooKeeper運行驗證 31

2.6.4 HBase安裝檔案的準備31

2.6.5 HBase的安裝及配置 31

2.6.6 HBase運行驗證 32

2.7　Flume 33

2.8　Kafka 35

2.9　Spark 37

2.9.1 Spark安裝檔案的準備 38

2.9.2 Spark的安裝及配置 38

2.9.3 Spark運行驗證 39