Hadoop+HBase技術項目教程

《Hadoop+HBase技術項目教程》是機械工業出版社於2022年出版的書籍,作者是張立輝 李明革

基本介紹

  • 中文名:Hadoop+HBase技術項目教程
  • 作者:張立輝、李明革
  • 出版社機械工業出版社
  • 出版時間:2022年6月24日
  • 定價:59.0 元
  • 開本:16 開
  • 裝幀:平裝
  • ISBN:9787111705239
  • 字數:351 千字
內容簡介,圖書目錄,

內容簡介

本書詳細介紹了大數據技術中的Hadoop 集群部署、MapReduce、Hive和HBase 等的基本知識和套用,本書採用了大量案例,可以更好地幫助讀者學習和理解大數據的核心技術。 本書從實用的角度出發,設計了9 個項目,從虛擬機安裝入手,結合實際工作中的典型項目和案例,全面介紹了Hadoop 集群部署、HDFS、MapReduce 編程、Hive、HBase 和Sqoop 的相關知識和基本操作。 本書圍繞Linux 作業系統和Hadoop 集群部署,按照初學者的思維習慣,循序漸進地設計和安排學習內容,採用將基礎知識融入項目教學的方式,在完成項目學習的同時,實現從理論知識到能力的轉化,幫助學習者牢固掌握Hadoop 集群部署等相關知識的實踐技能。 本書適合作為職業類院校計算機、大數據等相關專業的教材,也適用於計算機培訓班教學,以及有構建大數據知識體系需求的讀者學習。

圖書目錄

目錄
前言
項目1 Hadoop 安裝
1.1 大數據認知
1.1.1 大數據是什麼
1.1.2 大數據套用領域
1.1.3 大數據的特點
1.1.4 大數據的技術架構
1.2 Hadoop 認知
1.2.1 Hadoop 起源
1.2.2 Hadoop 的特點
1.2.3 Hadoop 生態圈
1.2.4 Hadoop 核心架構
項目實現
任務1 安裝前準備
任務2 虛擬機的安裝
任務3 Ubuntu 的安裝
任務4 解壓與壓縮命令
任務5 JDK 安裝和配置
任務6 Hadoop 的安裝
拓展項目
課後練習
項目2 Hadoop 集群部署
2.1 Linux 環境設定
2.1.1 Linux 常用命令
2.1.2 用戶(組)創建
2.1.3 FileZilla 檔案傳輸
2.1.4 apt 更新
2.1.5 vim 編輯器的套用
2.1.6 網路配置
2.2 Hadoop 配置檔案
2.2.1 環境變數的配置
2.2.2 SSH 安裝
2.2.3 core-site.xml 配置檔案
2.2.4 hdfs-site.xml 配置檔案
2.2.5 Hadoop 偽分散式運行實例
2.3 YARN 認知
2.3.1 初識YARN
2.3.2 YARN 基本服務組件
2.3.3 YARN 執行過程
項目實現
任務1 部署前準備
任務2 集群網路配置
任務3 配置檔案的設定
任務4 集群部署
拓展項目
課後練習
項目3 HDFS-電影信息管理
3.1 HDFS 認知
3.1.1 HDFS 簡介
3.1.2 HDFS 特點
3.1.3 HDFS 設計原則
3.1.4 HDFS 核心概念
3.2 HDFS 常用Shell 命令和基礎編程開發
3.2.1 HDFS 常用Shell 命令
3.2.2 用HDFS API 實現上傳本地檔案
3.2.3 用HDFS API 實現創建HDFS 檔案
3.2.4 用HDFS API 實現讀取和寫入檔案
3.2.5 用HDFS API 實現創建HDFS 目錄
3.2.6 用HDFS API 實現查找檔案所在位置
3.3 HDFS 工作機制
3.3.1 HDFS 寫數據流程
3.3.2 HDFS 讀數據流程
3.3.3 NameNode 工作機制
3.3.4 DataNode 工作機制
項目實現
任務1 環境搭建
任務2 寫入電影信息
任務3 讀取電影信息
拓展項目
課後練習
項目4 用MapReduce 統計網站最大訪問次數
4.1 MapReduce 認知
4.1.1 MapReduce 的由來
4.1.2 MapReduce 的執行過程
4.1.3 Mapper 過程
4.1.4 Reduce 過程
4.1.5 Shuffle 過程
4.2 MapReduce 程式開發
4.2.1 IDEA 安裝
4.2.2 MapReduce 輸入/輸出類型
4.2.3 MapReduce 輸入處理類
4.2.4 MapReduce 輸出處理類
4.2.5 典型案例:WordCount
項目實現
任務1 POJO 類編寫
任務2 Map 網站訪問數據
任務3 Reduce 網站訪問數據
任務4 項目驅動類編寫
拓展項目
課後練習
項目5 用MapReduce 實現課程名稱和成績的二次排序
5.1 MapReduce 高級開發一
5.1.1 Combiner 合併編程
5.1.2 Partitioner 分區編程
5.1.3 RecordReader 編程
5.2 MapReduce 高級開發二
5.2.1 MapReduce 連線操作
5.2.2 MapReduce 排序操作
5.2.3 MapReduce 多檔案聯合查詢
項目實現
任務1 POJO 類編寫
任務2 Map 課程和成績數據
任務3 Reduce 課程和成績數據
任務4 項目驅動類編寫
拓展項目
課後練習

相關詞條

熱門詞條

聯絡我們