Hadoop大數據技術原理與套用（第2版）

內容簡介

本書以Hadoop 3.x為主線，全面介紹Hadoop及其生態體系中常用的大數據開源項目的安裝和使用。全書共11章，分別講解大數據概念、Hadoop基礎知識、Hadoop集群部署、HDFS、MapReduce、YARN、ZooKeeper、Hive、Flume、Azkaban和Sqoop，並在最後開發一個完整的網站流量日誌分析系統，幫助讀者鞏固前面所學的內容。本書附有配套視頻、教學課件、教學設計、測試題等資源；同時，為了幫助初學者更好地學習本書的內容，還提供線上答疑，歡迎讀者關注。

圖書目錄

第1章初識Hadoop1

1.1大數據概述1

1.1.1什麼是大數據1

1.1.2大數據的數據類型2

1.1.3大數據的特徵2

1.1.4研究大數據的意義3

1.2大數據的套用場景3

1.2.1醫療行業的套用3

1.2.2金融行業的套用4

1.2.3零售行業的套用4

1.3Hadoop概述5

1.3.1Hadoop的前世今生5

1.3.2Hadoop的優點6

1.3.3Hadoop的缺點6

1.3.4Hadoop的生態體系6

1.3.5Hadoop架構變遷8

1.4本章小結10

1.5課後習題10

第2章部署Hadoop11

2.1安裝準備11

2.1.1創建虛擬機11

2.1.2克隆虛擬機21

2.1.3配置虛擬機23

2.1.4安裝JDK31

2.2Hadoop集群部署模式33

2.3基於偽分散式模式部署Hadoop34

2.4基於完全分散式模式部署Hadoop40

2.5案例——詞頻統計47

2.6本章小結50

2.7課後習題51

第3章HDFS分散式檔案系統52

3.1檔案系統的分類52

3.2HDFS簡介54

3.2.1HDFS架構54

3.2.2HDFS的特點56

3.3HDFS的檔案讀寫流程57

3.4HDFS的健壯性59

3.5HDFS的Shell操作60

3.5.1HDFS Shell介紹60

3.5.2案例——通過Shell腳本定時採集數據到HDFS …68

3.6HDFS的Java API操作72

3.6.1HDFS的Java API介紹72

3.6.2案例——使用Java API操作HDFS73

3.7Federation機制82

3.7.1Federation機制的實現原理82

3.7.2Federation機制的特點84

Hadoop大數據技術原理與套用（第2版）

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條