大數據Hadoop 3.X分散式處理實戰

內容簡介

本書以實戰開發為原則，以Hadoop 3.X生態系統內的主要大數據工具整合套用及項目開發為主線，通過Hadoop大數據開發中常見的11個典型模組和3個完整項目案例，詳細介紹HDFS、MapReduce、HBase、Hive、Sqoop、Spark等主流大數據工具的整合使用。本書附帶資源包括本書核心內容的教學視頻，本書所涉及的原始碼、參考資料等。

全書共14章，分為3篇，涵蓋的主要內容有Hadoop及其生態組件偽分散式安裝和完全分散式安裝、分散式檔案系統HDFS、分散式計算框架MapReduce、NoSQL資料庫HBase、分散式數據倉庫Hive、數據轉換工具Sqoop、記憶體計算框架Spark、海量Web日誌分析系統、電商商品推薦系統、分散式垃圾訊息識別系統等。

本書內容豐富、案例典型、實用性強，適合各個層次希望學習大數據開發技術的人員閱讀，尤其適合有一定Java 基礎而要進行Hadoop套用開發的人員閱讀。

圖書目錄

第一篇　Hadoop技術　1

第1章　大數據與Hadoop概述　03

1.1　大數據概述　03

1.1.1　大數據的定義　03

1.1.2　大數據行業的發展　04

1.1.3　大數據的典型套用　04

1.2　Hadoop概述　06

1.2.1　Hadoop簡介　06

1.2.2　Hadoop生態子項目　07

1.2.3　Hadoop 3.X的新特性　09

1.3　小結　09

1.4　配套視頻　10

第2章　Hadoop偽分散式安裝　11

2.1　Hadoop偽分散式安裝前的準備　11

2.1.1　安裝VMware　11

2.1.2　安裝CentOS 7　12

2.1.3　配置CentOS 7：接受協定　15

2.1.4　配置CentOS 7：登錄系統　16

2.1.5　配置CentOS 7：設定IP　16

2.1.6　配置CentOS 7：修改主機名　17

2.1.7　配置CentOS 7：配置hosts檔案　18

2.1.8　配置CentOS 7：關閉防火牆　18

2.1.9　配置CentOS 7：禁用selinux　19

2.1.10　配置CentOS 7：設定SSH免密碼登錄　19

2.1.11　配置CentOS 7：重啟　20

2.2　Hadoop偽分散式安裝　21

2.2.1　安裝WinSCP　21

2.2.2　安裝PieTTY　22

2.2.3　安裝JDK　23

2.2.4　安裝Hadoop　24

大數據Hadoop 3.X分散式處理實戰

基本介紹

內容簡介

圖書目錄

熱門詞條