Hadoop大數據技術基礎及套用

Hadoop大數據技術基礎及套用

《Hadoop大數據技術基礎及套用》是2020年3月機械工業出版社出版的圖書,作者是大講台大數據研習社。

基本介紹

  • 書名:Hadoop大數據技術基礎及套用
  • 作者:大講台大數據研習社 
  • ISBN:9787111620167 
  • 定價:69元
  • 出版社:機械工業出版社
  • 出版時間:2020年3月
內容簡介,圖書目錄,

內容簡介

本書系統介紹了Hadoop生態系統的核心開發技術,包括:Hadoop大數據技術概述、Hadoop開發及運行環境搭建、HDFS分散式檔案系統、MapReduce分散式計算技術框架、Hadoop的檔案I/O以及YARN資源管理器、Zookeeper分散式協調服務、Hadoop分散式集群搭建與管理、Hive 數據倉庫和HBase分散式資料庫、Hadoop生系系統常用開發技術,並通過廣電收視率數據統計分析和視頻網站爬蟲系統開發兩個實踐項目,詳細直觀地介紹了大數據項目的開發思路及流程。 本書通俗易懂、結構清晰,內容層層遞進,理論與實踐相結合,通過大量的實戰案例,引導讀者逐步深入學習,從而全面掌握Hadoop生態系統相關技術。

圖書目錄

前言
第1章 Hadoop大數據技術概述
1.1 Hadoop 的前世今生
1.2 Hadoop生態系統簡介
1.3 Hadoop優勢及套用領域
1.4 Hadoop與雲計算
1.5 Hadoop與Spark
1.6 Hadoop 與傳統關係型資料庫
第2章 Hadoop開發及運行環境搭建
2.1 Hadoop集群環境搭建概述
2.2 Hadoop偽分散式集群環境搭建
2.3 搭建MyEclipse開發環境
第3章 HDFS分散式檔案系統
3.1 HDFS體系結構詳解
3.2 HDFS的Shell操作
3.3 HDFS的Java API操作
3.4 HDFS的新特性——HA
3.5 實戰:小檔案合併程式編寫及運行
第4章 MapReduce分散式計算框架
4.1 初識MapReduce
4.2 MapReduce編程模型
4.3 MapReduce運行框架
4.4 實戰:統計相同字母組成的不同單詞
第5章 Hadoop的檔案I/O
5.1 Hadoop檔案I/O概述
5.2 Hadoop檔案I/O的數據完整性
5.3 Hadoop檔案的序列化
5.4 Hadoop數據的解壓縮
5.5* 基於檔案的數據結構
5.6* 實戰:Hadoop源碼編譯及Snappy壓縮的配置使用
第6章 YARN資源管理器
6.1 初識YARN
6.2 YARN基本架構
6.3 YARN的工作原理
6.4 YARN的容錯性
6.5 YARN HA
第7章* Zookeeper分散式協調服務
7.1 Zookeeper概述
7.2 Zookeeper安裝配置
7.3 Zookeeper 服務
7.4 Zookeeper的套用
7.5 實戰:模擬實現集群配置信息的訂閱與發布
第8章 Hadoop分散式集群搭建與管理
8.1 物理集群準備
8.2 集群規劃
8.3 集群安裝前的準備
8.4 Hadoop相關軟體安裝
8.5 Hadoop集群環境搭建
8.6 集群啟停
8.7* 主機維護操作
8.8* 集群節點動態增加與刪除
8.9* 集群運維技巧
第9章 Hive數據倉庫
9.1 初識Hive
9.2 Hive的原理及架構
9.3 Hive的安裝部署
9.4 Hive資料庫相關操作
9.5 Hive數據表相關的操作
9.6 Hive的數據操作語言DML
9.7 Hive的數據查詢語言DQL
9.8 實戰:通過Hive分析股票走勢規律
第10章 HBase分散式資料庫
10.1 HBase 概述
10.2 HBase 數據模型
10.3 HBase核心概念
10.4 HBase集群安裝部署
10.5 HBase Shell 工具
10.6 HBase Java客戶端
10.7 實戰:MapReduce批量操作HBase
第11章 Hadoop生態系統常用開發技術
11.1 Sqoop數據導入導出工具
11.2 Flume日誌採集系統
11.3 Kafka分散式訊息系統
11.4* ElasticSearch全文檢索工具
11.5* Storm流式計算框架
11.6* Spark記憶體計算框架
第12章 項目實踐:廣電收視率數據統計分析
第13章* 項目實踐:視頻網站爬蟲系統開發
參考文獻

相關詞條

熱門詞條

聯絡我們