Hadoop大數據技術項目化教程

《Hadoop大數據技術項目化教程》是2023年電子工業出版社出版的圖書,作者是石慧、謝志明。

基本介紹

  • 書名:Hadoop大數據技術項目化教程
  • 作者:石慧、謝志明
  • 出版社:電子工業出版社
  • 出版時間:2023年1月
  • 頁數:384 頁
  • 定價:68.80 元
  • 開本:16 開
  • ISBN:9787121447952
內容簡介,圖書目錄,

內容簡介

本書作為 Hadoop 大數據技術的項目化實戰教材,以任務驅動為導向,深入淺出地介紹了 Hadoop 及其周框線架的套用,涵蓋了當前 Hadoop 生態系統中的主流大數據技術。全書共 12 個項目,包括雲計算和大數據基礎概論、CentOS 的安裝與網路配置、MPI 集群部署及套用、Hadoop 集群部署及套用、MapReduce 基本原理及套用、HBase 資料庫的搭建及使用、Hive 數據倉庫的安裝及套用、Pig 數據分析、Sqoop 數據遷移、Flume 日誌收集系統、Spark 部署及數據分析、大數據技術編程實例。本書秉承“實踐為主、理論夠用、注重實用”原則,在任務實施中融入各個知識點與課程教學內容,以便讀者能更好地學習和掌握大數據關鍵技術。本書既可以作為高職高專院校和套用型本科院校計算機相關專業的教材,還可以作為 IT 類培訓機構培訓雲計算和大數據技術等相關課程的實訓教材,並可以作為相關技術人員的參考書。

圖書目錄

項目 1 雲計算和大數據基礎概論 …………………………………………………………… 1
任務 1 認識雲計算 ……………………………………………………………………… 1
任務 2 雲計算中的虛擬化技術 ………………………………………………………… 7
任務 3 雲計算與大數據 …………………………………………………………………13
任務 4 大數據的技術架構 ………………………………………………………………16
任務 5 大數據的套用前景 ………………………………………………………………18
任務 6 大數據的發展歷程及其面臨的挑戰 ……………………………………………22
項目 2 CentOS 的安裝與網路配置 ……………………………………………………… 27
任務 1 Linux 作業系統概述 ……………………………………………………………27
任務 2 使用 VMware 虛擬機安裝 CentOS ……………………………………………32
任務 3 CentOS 網路環境配置 …………………………………………………………54
任務 4 yum 源設定及使用 ………………………………………………………………62
項目 3 MPI 集群部署及套用 ……………………………………………………………… 72
任務 1 NTP 時間同步設定 ……………………………………………………………72
任務 2 SSH 證書登錄……………………………………………………………………78
任務 3 使用 NFS 設定已分享資料夾 ………………………………………………………82
任務 4 MPI 的安裝及測試 ………………………………………………………………86
任務 5 MPI 編程實戰 ……………………………………………………………………91
項目 4 Hadoop 集群部署及套用 ………………………………………………………… 100
任務 1 Hadoop 集群部署前的準備工作 …………………………………………… 100
任務 2 Hadoop 的安裝 ……………………………………………………………… 106
任務 3 Hadoop 偽分散式部署及套用 ……………………………………………… 110
任務 4 Hadoop 分散式部署及套用 ………………………………………………… 114
項目 5 MapReduce 基本原理及套用 …………………………………………………… 122
任務 1 MapReduce 工作原理及工作流程 …………………………………………… 122
任務 2 詞頻統計編程實踐 …………………………………………………………… 125
任務 3 數據合併去重編程實踐 ……………………………………………………… 136
任務 4 數據排序編程實踐 …………………………………………………………… 140
項目 6 HBase 資料庫的搭建及使用 …………………………………………………… 146
任務 1 HBase 安裝及偽分散式部署 ………………………………………………… 146
任務 2 HBase 完全分散式部署 ……………………………………………………… 150
任務 3 HBase 操作實踐 ……………………………………………………………… 156
任務 4 HBase 編程實踐 ……………………………………………………………… 163
項目 7 Hive 數據倉庫的安裝及套用 …………………………………………………… 175
任務 1 Hive 基本概念………………………………………………………………… 175
任務 2 Hive 安裝及部署……………………………………………………………… 178
任務 3 Hive 基本命令和套用………………………………………………………… 190
項目 8 Pig 數據分析 ……………………………………………………………………… 208
任務 1 Pig 基本概念 ………………………………………………………………… 208
任務 2 Pig 安裝及部署 ……………………………………………………………… 211
任務 3 Pig 命令語法和使用 ………………………………………………………… 216
任務 4 Pig 簡單編程 ………………………………………………………………… 235
項目 9 Sqoop 數據遷移…………………………………………………………………… 244
任務 1 Sqoop 基本概念 ……………………………………………………………… 244
任務 2 Sqoop 安裝及部署 …………………………………………………………… 247
任 務 3 利 用 Sqoop 工具實現 MySQL 與
HDFS 之間數據遷移 …………………………………………………………………… 254
任務 4 利用 Sqoop 工具實現 MySQL 與 Hive/HBase 之間數據遷移……………… 265
項目 10 Flume 日誌收集系統 …………………………………………………………… 278
任務 1 Flume 系統概述 ……………………………………………………………… 278
任務 2 Flume 安裝和部署 …………………………………………………………… 282
任務 3 Flume 套用案例 ……………………………………………………………… 291
項目 11 Spark 部署及數據分析 ………………………………………………………… 305
任務 1 Spark 基本概念 ……………………………………………………………… 305
任務 2 Spark 安裝及部署 …………………………………………………………… 308
任務 3 Spark 數據分析 ……………………………………………………………… 317
任務 4 Spark 套用案例 ……………………………………………………………… 332
項目 12 大數據技術編程實例 …………………………………………………………… 347
任務 1 能耗數據分析及處理 ………………………………………………………… 347
任務 2 餐飲大數據分析及處理 ……………………………………………………… 360
參考文獻……………………………………………………………………………………… 371

相關詞條

熱門詞條

聯絡我們