大數據技術(2021年人民郵電出版社出版的圖書)

內容簡介

本書從技術實戰的角度，帶領讀者一步一步掌握大數據的相關技能。本書不僅提供相應命令、配置檔案，還提供模擬環境演示等，並儘可能通過案例和實操降低大數據學習的門檻，力求讓讀者學以致用。

本書主要內容包括大數據技術概述、Linux基礎與集群搭建、Hadoop集群配置、HDFS、MapReduce分散式編程、Hive大數據倉庫、HBase資料庫部署與操作、數據獲取與Flume套用、基於Spark的記憶體計算，以及利用大數據平台處理圖像及視頻。

圖書目錄

第1章大數據技術概述 1

1.1　大數據的概念與基本特性　1

1.2　大數據處理流程　2

1.3　Hadoop大數據技術　3

1.3.1　Hadoop簡介　3

1.3.2　Hadoop的發行版本　5

1.4　實踐環境準備　7

習題　15

第2章　Linux基礎與集群搭建　16

2.1　Linux常用命令　16

2.1.1　用戶和用戶組　16

2.1.2　檔案與目錄　18

2.1.3　主機名　24

2.1.4　分區管理　25

2.2　網路配置　27

2.2.1　基本網路配置　27

2.2.2　集群網路配置　28

2.3　Linux集群配置　31

2.3.1　SSH免密碼登錄　31

2.3.2　Java環境安裝　33

2.3.3　MySQL服務　34

2.3.4　配置時鐘同步　35

2.4　快速配置Linux集群　37

2.4.1　導入虛擬機　37

2.4.2　快速配置　39

習題　42

第3章　Hadoop集群配置　43

3.1　Hadoop集群安裝　43

3.1.1　基礎環境準備　43

3.1.2　配置Java環境　49

3.1.3　安裝Hadoop　51

3.1.4　啟動Hadoop　58

3.2　Hadoop集群初始化和日誌查看　62

3.2.1　初始化檔案系統　62

3.2.2　集群的啟動與停止　62

3.2.3　查看日誌　63

習題　64

第4章　HDFS　65

4.1　HDFS簡介　65

4.1.1　HDFS的基本概念　65

4.1.2　HDFS檔案的讀取　66

4.1.3　HDFS檔案的寫入　67

4.1.4　HDFS 數據備份　68

4.2　HDFS基本命令　69

4.3　HDFS數據平衡最佳化　72

4.3.1　編程原則　73

4.3.2　平衡邏輯　73

4.3.3　數據平衡案例　74

4.4　HDFS API的使用方法　75

習題　81

第5章　MapReduce分散式編程

　82

5.1　MapReduce簡介　82

5.2　詞頻統計編程實例　83

大數據技術(2021年人民郵電出版社出版的圖書)

基本介紹

內容簡介

圖書目錄

作者簡介

相關詞條

熱門詞條