實戰Hadoop大數據處理

內容簡介

本書以“大數據”為起點，較詳細地介紹了Hadoop的相關知識。全書共分為9章，介紹了大數據的基本理論、Hadoop生態系統、Hadoop的安裝、HDFS分散式檔案系統、MapReduce的原理及開發、HBase資料庫、Hive數據倉庫、Sqoop數據轉換工具，最後結合實際介紹了大數據在智慧型交通和情報分析中的套用。本書力求用淺顯的語言、生動的案例、詳細的操作步驟向廣大讀者介紹Hadoop；力求深入淺出，把複雜的理論與實際案例相結合，用平實的語言把深奧的原理簡單化；力求圖文並茂，通過適當的圖表把零亂的知識點有序地展現在讀者面前；力求緊跟時代步伐，儘量結合較新版本的軟體闡述大數據處理的相關知識。

本書適合作為Hadoop技術的初學者、工程技術人員、大專院校研究生或高年級本科生的學習用書或參考書。

圖書目錄

第1章大數據概述1

1.1大數據簡介1

1.1.1大數據的概念與特點2

1.1.2大數據研究的背景4

1.1.3大數據的套用示例5

1.1.4大數據研究的意義6

1.2大數據處理技術簡介6

1.2.1大數據的關鍵技術6

1.2.2大數據處理模式及其系統9

1.3大數據帶來的挑戰13

1.4大數據的研究與發展方向14

第2章Hadoop簡介16

2.1Hadoop項目起源17

2.2Hadoop的由來19

2.3Hadoop核心組件及相關項目簡介21

2.4Hadoop的版本衍化26

2.5Hadoop的發展趨勢26

第3章Hadoop的安裝28

3.1安裝Ubuntu Server28

3.1.1VMware網路適配器的連線模式28

3.1.2“僅主機模式”網路的設定29

3.1.3安裝Ubuntu Server31

3.1.4遠程管理Ubuntu Server37

3.1.5安裝JDK39

3.1.6克隆其他虛擬機41

3.1.7配置hosts檔案43〖2〗〖4〗實戰Hadoop大數據處理〖3〗3.2配置SSH公鑰認證43

3.2.1為什麼要公鑰認證43

3.2.2公鑰認證的工作原理44

3.2.3SSH客戶端的安裝44

3.2.4SSH配置45

3.2.5配置SecureCRT公鑰登錄Linux伺服器47

3.3安裝配置Hadoop49

3.3.1單機安裝50

3.3.2偽分布模式的安裝51

3.3.3分散式安裝53

3.3.4Hadoop管理員常用命令58

3.4雙NameNode分散式安裝Hadoop 2.2.063

3.4.1安裝配置Zookeeper集群64

實戰Hadoop大數據處理

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條