《基於Hadoop與Spark的大數據開發實戰》是2018年人民郵電出版社出版的圖書。
基本介紹
- 中文名:基於Hadoop與Spark的大數據開發實戰
- 作者:肖睿 丁科 吳剛山
- 出版時間:2018年
- 出版社:人民郵電出版社
- ISBN:9787115477644
- 開本:16 開
- 裝幀:平裝-膠訂
《基於Hadoop與Spark的大數據開發實戰》是2018年人民郵電出版社出版的圖書。
《Hadoop & Spark大數據開發實戰》是2017年中國水利水電出版社出版的圖書,作者是肖睿、雷剛躍、宋麗萍、張宇、彭英。內容簡介 大數據讓我們以一種前所未有的方式,通過對海量數據進行分析,獲得有巨大價值的產品和服務,*終形成變革之力...
《Hadoop + Spark 大數據巨量分析與機器學習整合開發實戰》是2017年清華大學出版社出版的圖書,作者是林大貴。前言 大數據的影響力正深入到各個領域和行業中。特別在商業、經濟以及其他領域,將大量數據進行分析後,便可得到許多數據的關聯性...
《Hadoop+Spark大數據分析實戰》是清華大學出版社於2022年出版的書籍,作者是遲殿委。內容簡介 本書是Hadoop + Spark大數據分析技術入門書,基於Hadoop和Spark兩大框架體系的3.2版本,以通俗易懂的方式介紹Hadoop + Spark原生態組件的原理、...
《Hadoop大數據技術開發實戰》是2019年10月清華大學出版社出版的圖書,作者是張偉洋。內容簡介 本書以Hadoop及其周框線架為主線,介紹了整個Hadoop生態系統主流的大數據開發技術。全書共16章,第1章講解了VMware中CentOS 7作業系統的安裝;第2...
《Python+Spark 2.0+Hadoop機器學習與大數據實戰》是2018年1月1日清華大學出版社出版的圖書,作者是林大貴。內容簡介 本書從淺顯易懂的“大數據和機器學習”原理說明入手,講述大數據和機器學習的基本概念,如分類、分析、訓練、建模、預測...
《Hadoop大數據實戰權威指南(第2版)》是2019年9月電子工業出版社出版的圖書,作者是黃東軍。 內容簡介 基於深入分析組件原理、充分展示搭建過程、詳細指導套用開發”的理念,以最新版Hadoop及其生態組件為對象,採用理論與套用高度融合的...
《Hadoop + Spark生態系統操作與實戰指南》是2017年9月1日清華大學出版社出版的圖書,作者是餘輝。內容簡介 本書用於Hadoop+Spark快速上手,全面解析Hadoop和Spark生態系統,通過原理解說和實例操作每一個組件,讓讀者能夠輕鬆跨入大數據分析...
《實戰大數據(Hadoop+Spark+Flink)——從平台構建到互動式數據分析(離線/實時)》詳細介紹了大數據工程師在實際工作中應該熟練掌握的大數據技術。全書共8章,分別是大數據技術概述、搭建IDEA開發環境及Linux虛擬機、基於Hadoop構建大數據平台...
第一篇為大數據的基本概念和技術,主要介紹大數據的背景、發展及關鍵技術;第二篇為Hadoop大數據平台搭建與基本套用,內容涉及Linux、HDFS、MapReduce、YARN、Hive、HBase、Sqoop、Kafka、Spark等;第三篇為大數據處理與項目開發,包括互動式...
第2章Spark基礎33 2.1初識Spark33Spark大數據分析與實戰 2.1.1Spark概述33 2.1.2Spark的特點34 2.1.3Spark套用場景35 2.1.4Spark與Hadoop對比36 2.2搭建Spark開發環境37 2.2.1環境準備37 2.2.2Spark的部署方式37 2.2.3...
《Spark大數據分析技術與實戰》適合作為高等院校計算機相關專業的研究生學習參考資料,也適合大數據技術初學者閱讀,還適合所有願意對大數據技術有所了解並想要將大數據技術套用於本職工作的讀者閱讀。目錄 第1章 Spark導論 1 1.1 Spark的...
Hadoop堪稱業界最經典的開源雲計算和大數據平台軟體。本書系統介紹了Hadoop 2.0生態圈的核心和擴展組件,包括:管理工具Ambari、分散式檔案系統HDFS、分散式資源管理器YARN、分散式並行處理MapReduce、記憶體型計算框架Spark、數據流實時處理系統...
《Spark與Hadoop大數據分析》是2017年機械工業出版社出版的圖書。內容簡介 本書介紹了ApacheSpark和Hadoop的基礎知識,並深入探討了所有Spark組件:SparkCore、SparkSQL、DataFrame、DataSet、普通流、結構化流、MLlib、Graphx,以及Hadoop的核心...
Spark技術篇從Spark概述、Scala語言、環境搭建、RDD核心技術、Spark SQL和機器學習等多方面講解Spark大數據的開發,從基礎的Scala語言開始學習,並以Hadoop環境為基礎搭建Spark大數據集群,從最基礎、最常用、最容易理解的思路出發,幫助讀者逐步...
本書詳細闡述了與Hadoop 3大數據分析相關的基本解決方案,主要包括Hadoop簡介、大數據分析概述、基於MapReduce的大數據處理、Python-Hadoop科學計算和大數據分析、R-Hadoop統計數據計算、Apache Spark批處理分析、Apache Spark實時數據分析、Apache ...
《Cloudera Hadoop大數據平台實戰指南》是清華大學出版社2019年出版的圖書,作者是宋立桓、陳建平。內容簡介 本書分為18章,系統介紹Hadoop 生態系統大數據相關的知識,包括大數據概述、Cloudera Hadoop平台的安裝部署、HDFS分散式檔案系統、Map...
《高性能分散式計算系統開發與實現:基於Hadoop,Scalding和Spark》是2018年機械工業出版社出版的圖書,作者是斯里尼瓦沙。內容簡介 本書分兩部分,共8章,介紹了如何使用開源工具和技術開發與實現大規模分散式處理系統,涵蓋構建高性能分散式...
本書基礎理論、套用開發以及實際案例相結合,圍繞Hadoop、Spark生態圈循序漸進地介紹關於大數據技術領域中的基礎知識、套用開發技術和基於Spark的常見機器學習算法,最後以兩個實戰案例全面、系統地套用了本書介紹的基礎知識和套用開發方法。全書...
通過對應的實例全面、詳細地介紹了整個Spark實戰開發的流程。*後,還介紹了Spark的高級套用,包括Spark流應用程式及可擴展和快速的機器學習框架H2O。本書可以作為高等院校計算機、軟體工程、數據科學與大數據技術等專業的大數據課程材料,可用於...
著有圖書《Hive入門與大數據分析實戰》《Hadoop大數據分析技術》《Hadoop+Spark大數據分析實戰》《Spring Boot企業級開發實戰(視頻教學版)》《深入淺出Java編程》《Spring Boot+Spring Cloud微服務開發》。圖書目錄 第1章 Spark開發之Scala...
《大數據技術入門到商業實戰Hadoop+Spark+Flink全解析》是2021年機械工業出版社出版的圖書。本書全面詳細地介紹了大數據生態系統中的主流技術。全書共10章,主要包括大數據生態系統概述、大數據採集技術、大數據存儲技術、大數據分析處理技術等...
針對項目開發過程的每個環節都進行了深入講解,使讀者由淺入深地了解每個環節的知識內容。 本書共分為7章。第1章主要介紹項目開發的基本情況;第2章主要介紹大數據集群環境的搭建;第3章主要介紹通過Spark實現熱門品類Top10分析,並對分析...
《Spark 3.x大數據分析實戰(視頻教學版)》是2022年清華大學出版社出版的圖書,作者是張偉洋。內容簡介 本書基於Spark 3.2.x版本,從Spark核心程式語言Scala講起,涵蓋了當前整個Spark生態系統主流的大數據開發技術。全書共9章,第1章...