Hadoop大數據開發實戰

內容簡介

本書將大數據技術生態圈主流技術框架的套用與發展、搭建Hadoop大數據分散式系統集群平台、大數據分散式檔案系統HDFS（Hadoop Distributed File System）、大數據分散式並行計算框架MapReduce、大數據汽車銷售數據統計分析項目5大模組分為11章內容進行闡述。具體分布情況如下：第1章是大數據概論，介紹大數據的發展背景及基本概念；第2章是搭建Hadoop分散式集群；第3～6章是HDFS分散式檔案系統入門、HDFS接口、HDFS的運行機制、Hadoop I/O流操作；第7～10章是初識MapReduce編程模型、MapReduce套用編程開發、MapReduce編程案例、MapReduce運行機制與YARN平台；第11章是汽車銷售數據統計分析項目實戰。本書將理論與實踐相結合，介紹了大數據的核心技術，並通過介紹一個企業的開發項目，深入講解大數據技術在實際工作中的套用。

本書是為所有熱愛大數據、打算從事大數據相關工作的讀者而編寫的，適合有Java編程基礎的學習者參考使用，也適合作為高等院校、培訓機構的大數據技術教材。

圖書目錄

第 1章　大數據概論　1

1.1　大數據的學習基礎　1

1.2　大數據的背景　2

1.3　對大數據的不同認識　2

1.3.1　資深編程者眼中的大數據　2

1.3.2　行銷者和學者眼中的大數據　3

1.3.3　商家看大數據　4

1.4　大數據的行業案例　4

1.4.1　電子地圖　4

1.4.2　電子商務——用戶畫像　5

1.5　大數據的基本概念　6

1.5.1　兩個核心　6

1.5.2　分散式存儲　6

1.5.3　分散式計算　7

1.6　大數據技術生態圈　7

本章總結　8

本章習題　8

第 2章　搭建Hadoop分散式集群　9

2.1　雲平台　9

2.1.1　了解雲平台　9

2.1.2　安裝VMware軟體　9

2.2　安裝CentOS 6　10

2.2.1　安裝CentOS 6　10

2.2.2　安裝中的關鍵問題　15

2.2.3　克隆HadoopSlave和HadoopSlave1　16

2.2.4　安裝SSH客戶端傳輸軟體　18

2.2.5　安裝Xshell　20

2.3　Linux系統配置　23

2.4　Hadoop的配置部署　39

本章總結　47

本章習題　47

第3章　HDFS入門　48

3.1　Hadoop分散式檔案系統HDFS　48

3.1.1　認識HDFS　48

3.1.2　HDFS的優勢　49

3.1.3　HDFS局限性　50

3.1.4　HDFS特性　51

3.2　HDFS核心設計　52

3.2.1　數據塊　53

3.2.2　數據塊複製　53

Hadoop大數據開發實戰

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條