Hadoop大數據分析技術

Hadoop大數據分析技術

《Hadoop大數據分析技術》是清華大學出版社於2022年出版的書籍,作者是遲殿委、陳鵬程。

基本介紹

  • 中文名:Hadoop大數據分析技術
  • 作者:遲殿委、陳鵬程
  • 出版社:清華大學出版社
  • 出版時間:2022年11月1日
  • 定價:69 元
  • ISBN:9787302620990
內容簡介,圖書目錄,

內容簡介

伴隨Hadoop的成長,Hadoop不再是一個簡單的數據分散式存儲平台和工具,已經成長為一個完整的生態圈。本書採用Hadoop 3.2.2版本,系統講解Hadoop生態系統主流的大數據分析技術。本書配套示例源碼、PPT課件、教學大綱與編程環境。
本書共分11章。內容包括Hadoop概述與大數據環境準備、Hadoop偽分散式集群搭建、HDFS分散式存儲實戰、MapReduce實戰、ZooKeeper與高可用集群實戰、Hive數據倉庫實戰、HBase資料庫實戰、Flume數據採集實戰、Kafka實戰、影評大數據分析項目實戰、旅遊酒店評價大數據分析項目實戰。
本書可作為Hadoop大數據技術初學者的入門書,也可作為Hadoop大數據分析工程師的指導手冊,還可作為高等院校或者高職高專大數據專業的教材或教學參考書。

圖書目錄

第1章 Hadoop概述與大數據環境準備 1
1.1 大數據定義 2
1.2 Hadoop生態介紹 2
1.2.1 Hadoop簡介 2
1.2.2 Hadoop版本簡介 4
1.2.3 Hadoop生態系統和組件介紹 6
1.3 Hadoop 3新特性 7
1.4 虛擬機安裝 9
1.5 安裝Linux作業系統 10
1.6 SSH工具與使用 15
1.7 Linux統一設定 16
1.8 小結 18
第2章 Hadoop偽分散式集群搭建 19
2.1 安裝獨立運行的Hadoop 19
2.2 Hadoop偽分散式環境準備 22
2.3 Hadoop偽分散式安裝 26
2.4 HDFS操作命令 31
2.5 Java項目訪問HDFS 33
2.5.1 創建Maven項目 34
2.5.2 HDFS操作示例 36
2.6 winutils 38
2.7 快速MapReduce程式示例 39
2.8 小結 42
第3章 HDFS分散式存儲實戰 43
3.1 HDFS的體系結構 43
3.2 NameNode的工作 44
3.2.1 查看鏡像檔案 45
3.2.2 查看日誌檔案 46
3.2.3 日誌檔案和鏡像檔案的操作過程 47
3.3 SecondaryNameNode 49
3.4 DataNode 50
3.5 HDFS的命令 50
3.6 遠程過程調用 51
3.7 小結 53
第4章 MapReduce實戰 55
4.1 MapReduce的運算過程 55
4.2 WordCount示例 57
4.3 自定義Writable 60
4.4 Partitioner分區編程 64
4.5 自定義排序 66
4.6 Combiner編程 67
4.7 默認Mapper和默認Reducer 68
4.8 倒排索引 69
4.9 Shuffle 73
4.10 小結 77
第5章 ZooKeeper與高可用集群實戰 79
5.1 ZooKeeper簡介 79
5.1.1 Zxid 80
5.1.2 版本號 81
5.2 單一節點安裝ZooKeeper 82
5.3 基本客戶端命令 83
5.4 Java代碼操作ZooKeeper 86
5.5 ZooKeeper集群安裝 91
5.6 znode節點類型 92
5.7 觀察節點 93
5.8 配置Hadoop高可用集群 93
5.9 用Java代碼操作集群 102
5.10 小結 104
第6章 Hive數據倉庫實戰 105
6.1 Hive3的安裝配置 107
6.2 Hive的命令 110
6.3 Hive內部表 114
6.4 Hive外部表 116
6.5 Hive表分區 117
6.5.1 分區技術細節 117
6.5.2 分區示例 119
6.6 查詢示例匯總 121
6.7 Hive函式 122
6.8 Hive自定義函式 128
6.9 Hive視圖 132
6.10 hiveserver2 132
6.11 使用JDBC連線hiveserver2 134
6.12 小結 135
第7章 HBase資料庫實戰 136
7.1 HBase的特點 136
7.2 HBase安裝 139
7.2.1 HBase的單節點安裝 140
7.2.2 HBase的偽分散式安裝 142
7.2.3 Java客戶端代碼 144
7.3 HBase集群安裝 150
7.4 HBase Shell操作 153
7.4.1 數據模型定義 154
7.4.2 數據基本操作 156
7.5 協處理器 160
7.6 Phoenix 162
7.7 小結 168
第8章 Flume數據採集實戰 169
8.1 Flume的安裝與配置 170
8.2 快速示例 171
8.3 在ZooKeeper中保存Flume的配置檔案 172
8.4 Flume的更多Source 176
8.4.1 Avro Source 176
8.4.2 Thrift Source和Thrift Sink 180
8.4.3 Exec Source 183
8.4.4 Spool Source 184
8.4.5 HDFS Sinks 184
8.5 小結 185
第9章 Kafka實戰 186
9.1 Kafka的特點 187
9.2 Kafka術語 188
9.3 Kafka安裝與部署 189

相關詞條

熱門詞條

聯絡我們