《大數據技術原理與操作套用》是重慶大學出版社出版圖書。
《大數據技術原理與操作套用》
- 出版社: 重慶大學出版社
- ISBN:9787568923576
- 版次:1
- 商品編碼:12982978
- 品牌:重慶大學出版社
- 包裝:平裝
- 叢書名: 高職高專計算機系列教材
- 開本:16開
- 出版時間:2020-08-01
- 用紙:膠版紙
- 頁數:263
- 字數:438000
- 正文語種:中文
內容簡介
《大數據技術原理與操作套用》圍繞Hadoop生態圈相關組件系統介紹大數據架構。全書共10章,其中,第1、2章主要介紹Hadoop的概述以及如何搭建Hadoop的集群;第3章~第5章介紹分散式檔案系統(HDFS)、分散式計算框架(Ma-pReduce)以及分散式協調服務;第6章介紹Hadoop 2.0新特性,包含YARN和高可用集群的原理。第7章-第9章主要介紹Hadoop生態圈的相關輔助系統,包含Hive、Flume、Sqoop;第10章是綜合案例的開發,利用Hadoop的相關組件進行項目的開發,同時加深對Hadoop生態圈的技術的理解。
《大數據技術原理與操作套用》可以作為高職高專計算機相關專業、信息系統相關專業、數據科學相關專業的大數據平台課程教材,也可供一線技術人員參考。
目錄
第1章 初識Hadoop
1.1 大數據的介紹
1.2 Hadoop的介紹
習題1
第2章 Hadoop集群構建
2.1 Linux系統安裝
2.2 Linux系統網路配置
2.3 創建普通用戶
2.4 構建Hadoop完全分散式集群環境
2.5 Hadoop平台運行及測試
習題2
第3章 HDFS分散式檔案系統
3.1 Hadoop的檔案系統
3.2 HDFS的簡介
3.3 HDFS的架構及原理
3.4 HDFS的Shell操作
3.5 HDFS的Java API操作
習題3
第4章 MapReduce分散式計算系統
4.1 MapReduce的介紹
4.2 MapReduce運行機制
4.3 案例:使用MapReduce實現反向索引
習題4
第5章 ZooKeeper分散式協調服務
5.1 認識ZooKeeper
5.2 ZooKeeper的數據模型
5.3 ZooKeeper的Watch機制
5.4 ZooKeeper的選舉機制
5.5 ZooKeeper分散式集群部署
5.6 ZooKeeper的Shell操作
5.7 ZooKeeper Java API操作
5.8 ZooKeeper套用場景
習題5
第6章 Hadoop2.O新特性
6.1 Hadoop 2.0的改進與提升
6.2 YARN體系結構
6.3 YARN工作流程
6.4 HDFS HA的搭建方法
習題6
第7章 Hive數據倉庫
7.1 Hive的介紹
7.2 Hive的安裝部署
7.3 Hive的基本操作
習題7
第8章 日誌採集系統
8.1 Flume的介紹
8.2 Flume基本使用方法
8.3 Flume採集方案配置說明
8.4 Flume的可靠性保證
8.5 Flume攔截器
8.6 案例——日誌採集
習題8
第9章 Sqoop數據遷移
9.1 Sqoop的介紹
9.2 Sqoop數據導入
9.3 Sqoop數據導出
習題9
第10章 綜合項目案例
10.1 最高氣溫統計案例
10.2 電子商務離線數據統計案例
參考文獻