《Hadoop生態體系項目實戰》是2019年天津大學出版社出版的圖書,作者是天津濱海迅騰科技集團有限公司。
全書主要涉及八個項目,即Hadoop介紹、分散式檔案系統(HDFS)、強大的計算框架(Map Reduce)、數據倉庫工具(Hive)等內容。
基本介紹
- 中文名:Hadoop生態體系項目實戰
- 作者:天津濱海迅騰科技集團有限公司
- 出版社:天津大學出版社
- ISBN:9787561864760
《Hadoop生態體系項目實戰》是2019年天津大學出版社出版的圖書,作者是天津濱海迅騰科技集團有限公司。
全書主要涉及八個項目,即Hadoop介紹、分散式檔案系統(HDFS)、強大的計算框架(Map Reduce)、數據倉庫工具(Hive)等內容。
第二篇為平台搭建與基本套用,內容設計Linux、HDFS、MapReduce、Yarn、Hive、HBase、Sqoop、Kafka、Spark、Phoenix等;第三篇為數據處理與項目開發,綜合運用各類組件進行實際數據處理,包括互動式套用、決策、推薦算法、銷售數據分析系統等。
1.5.4Eclipse創建Maven項目16 1.5.5Eclipse其餘配置19 1.6小結21 第2章Hadoop集群搭建22 2.1虛擬機簡介22 2.2虛擬機配置24 2.3Linux系統設定31 2.4Apache版本Hadoop集群搭建36 2.5CDH版本Hadoop集群搭建44 2.5.1安裝前期準備...
《Hadoop 3.x大數據開發實戰(視頻教學版)》是清華大學出版社於2022年出版的書籍,作者是張偉洋 內容簡介 本書以Hadoop 3.x及其周框線架為主線,介紹了整個Hadoop生態系統主流的大數據開發技術。全書共16章,第1章講解VMware中CentOS 7...
《大數據Hadoop 3.X分散式處理實戰》是2020年4月人民郵電出版社出版的圖書,作者是吳章勇、楊強。內容簡介 本書以實戰開發為原則,以Hadoop 3.X生態系統內的主要大數據工具整合套用及項目開發為主線,通過Hadoop大數據開發中常見的11個典型...
發展及關鍵技術;第二篇為Hadoop大數據平台搭建與基本套用,內容涉及Linux、HDFS、MapReduce、YARN、Hive、HBase、Sqoop、Kafka、Spark等;第三篇為大數據處理與項目開發,包括互動式數據處理、協同過濾推薦系統、銷售數據分析系統,並就京東...
《Cloudera Hadoop大數據平台實戰指南》是清華大學出版社2019年出版的圖書,作者是宋立桓、陳建平。內容簡介 本書分為18章,系統介紹Hadoop 生態系統大數據相關的知識,包括大數據概述、Cloudera Hadoop平台的安裝部署、HDFS分散式檔案系統、Map...
書是劉鵬教授主編的國內第一本Hadoop編程書籍《實戰Hadoop》的第二版。Hadoop堪稱業界最經典的開源雲計算和大數據平台軟體。本書系統介紹了Hadoop 2.0生態圈的核心和擴展組件,包括:管理工具Ambari、分散式檔案系統HDFS、分散式資源管理器YARN...
《Hadoop+Spark大數據分析實戰》是清華大學出版社於2022年出版的書籍,作者是遲殿委。內容簡介 本書是Hadoop + Spark大數據分析技術入門書,基於Hadoop和Spark兩大框架體系的3.2版本,以通俗易懂的方式介紹Hadoop + Spark原生態組件的原理、...
第11章 Hadoop生態系統常用開發技術 11.1 Sqoop數據導入導出工具 11.2 Flume日誌採集系統 11.3 Kafka分散式訊息系統 11.4* ElasticSearch全文檢索工具 11.5* Storm流式計算框架 11.6* Spark記憶體計算框架 第12章 項目實踐:廣電收視率...
2.5 Java項目訪問HDFS 33 2.5.1 創建Maven項目 34 2.5.2 HDFS操作示例 36 2.6 winutils 38 2.7 快速MapReduce程式示例 39 2.8 小結 42 第3章 HDFS分散式存儲實戰 43 3.1 HDFS的體系結構 43 3.2 Name...
《Hadoop+Spark大數據技術(微課版)》是2018年11月清華大學出版社出版的圖書,作者是劉彬斌主、李柏章、周磊、李永富。內容簡介 全書內容分為大數據系統基礎、Hadoop技術、Spark技術和項目實戰4部分。其中,Linux是學習大數據技術的基礎,先...
5.3.6 【實戰】使用Unique實現數據去重 187 5.3.7 【實戰】使用項目空間資源 193 第6章 處理離線數據——基於MaxCompute Spark 196 6.1 MaxCompute Spark基礎 196 6.1.1 MaxCompute Spark的系統結構 196 6.1.2 M...
5.6.1 項目原型 186 5.6.2 基本的數據採集 188 5.6.3 應對採集作業逾時 193 5.6.4 應對數據延遲就緒 197 第6章 主數據管理 202 6.1 主數管理據系統的建設策略 202 6.2 原型設計 204 6.3 ...
任務2 認識Hadoop生態系統 / 6 1.2.1 Hadoop生態系統概述 / 6 1.2.2 Hadoop行業套用案例 / 12 項目小結 / 13 課後練習 / 13 項目2 Linux作業系統的安裝及常用命令 / 14 任務1 安裝及配置Linux虛擬機 / 14 2....
課程體系 大數據專業:基礎階段、JavaSE階段、資料庫階段、JavaEE階段、企業級套用、Hadoop生態體系階段、Spark計算框架體系階段、Flink實時計算系統階段、就業階段 Java學科:基礎階段、JavaSE階段、資料庫階段、JavaEE階段、企業級套用、前...
8.4.2 Spark SQL系統架構 297 8.4.3 HiveContext和SQLContext的運行過程 298 8.4.4 Shark和Spark SQL 299 8.4.5 Spark SQL基本操作 303 8.5 案例 305 8.5.1 大數據倉庫設計案例 305 8.5.2 YouTuBe項目實戰 307 習題 ...