Hadoop海量數據處理技術詳解與項目實戰（第2版）

基本簡介

本書介紹了Hadoop技術的相關知識，並將理論知識與實際項目相結合。全書共分為三個部分：基礎篇、套用篇和總結篇。基礎篇詳細介紹了Hadoop、YARN、MapReduce、HDFS、Hive、Sqoop和HBase，並深入探討了Hadoop的運維和調優；套用篇則包含了一個具有代表性的完整的基於Hadoop的商業智慧型系統的設計和實現；結束篇對全書進行總結，並對技術發展做了展望。

圖書目錄

基礎篇：Hadoop基礎

第1章　緒論　2

1.1　Hadoop和雲計算　2

1.1.1　Hadoop的電梯演講　2

1.1.2　Hadoop生態圈　3

1.1.3　雲計算的定義　6

1.1.4　雲計算的類型　7

1.1.5　Hadoop和雲計算　8

1.2　Hadoop和大數據　9

1.2.1　大數據的定義　9

1.2.2　大數據的結構類型　10

1.2.3　大數據行業套用實例　12

1.2.4　Hadoop和大數據　13

1.2.5　其他大數據處理平台　14

1.3　數據挖掘和商業智慧型　15

1.3.1　數據挖掘的定義　15

1.3.2　數據倉庫　17

1.3.3　運算元據庫系統和數據倉庫系統的區別　18

1.3.4　為什麼需要分離的數據倉庫　19

1.3.5　商業智慧型　19

1.3.6　大數據時代的商業智慧型　20

1.4　小結　21

第2章　環境準備　22

2.1　Hadoop的發行版本選擇　22

2.1.1　Apache Hadoop　22

2.1.2　CDH　22

2.1.3　Hadoop的版本　23

2.1.4　如何選擇Hadoop的版本　25

2.2　Hadoop架構　26

2.2.1　Hadoop HDFS架構　27

2.2.2　YARN架構　28

2.2.3　Hadoop架構　28

2.3　安裝Hadoop　29

2.3.1　安裝運行環境　30

2.3.2　修改主機名和用戶名　36

2.3.3　配置靜態IP位址　36

2.3.4　配置SSH無密碼連線　37

2.3.5　安裝JDK　38

2.3.6　配置Hadoop　39

2.3.7　格式化HDFS　42

2.3.8　啟動Hadoop並驗證安裝　42

2.4　安裝Hive　43

2.4.1　安裝元資料庫　44

2.4.2　修改Hive配置檔案　44

2.4.3　驗證安裝　45

2.5　安裝HBase　46

2.5.1　解壓檔案並修改Zookeeper相關配置　46

2.5.2　配置節點　46

2.5.3　配置環境變數　47

2.5.4　啟動並驗證　47

2.6　安裝Sqoop　47

2.7　Cloudera Manager　48

2.8　小結　51

Hadoop海量數據處理技術詳解與項目實戰（第2版）

基本簡介

圖書目錄

相關詞條

熱門詞條