《Spark與Hadoop大數據分析》是2017年機械工業出版社出版的圖書。
基本介紹
- 中文名:Spark與Hadoop大數據分析
- 作者:(美)文卡特·安卡姆
- 出版社:機械工業出版社
- 出版時間:2017年
- ISBN:9787111569411
《Spark與Hadoop大數據分析》是2017年機械工業出版社出版的圖書。
《Hadoop + Spark 大數據巨量分析與機器學習整合開發實戰》是2017年清華大學出版社出版的圖書,作者是林大貴。前言 大數據的影響力正深入到各個領域和行業中。特別在商業、經濟以及其他領域,將大量數據進行分析後,便可得到許多數據的關聯性...
《Hadoop+Spark大數據分析實戰》是清華大學出版社於2022年出版的書籍,作者是遲殿委。內容簡介 本書是Hadoop + Spark大數據分析技術入門書,基於Hadoop和Spark兩大框架體系的3.2版本,以通俗易懂的方式介紹Hadoop + Spark原生態組件的原理、...
《Hadoop+Spark大數據技術(微課版)》是2018年11月清華大學出版社出版的圖書,作者是劉彬斌主、李柏章、周磊、李永富。內容簡介 全書內容分為大數據系統基礎、Hadoop技術、Spark技術和項目實戰4部分。其中,Linux是學習大數據技術的基礎,先...
《Python+Spark 2.0+Hadoop機器學習與大數據實戰》是2018年1月1日清華大學出版社出版的圖書,作者是林大貴。內容簡介 本書從淺顯易懂的“大數據和機器學習”原理說明入手,講述大數據和機器學習的基本概念,如分類、分析、訓練、建模、預測...
《HadoopSpark大數據機器學習》是2021年科學出版社出版的圖書。內容簡介 人類已進入大數據時代。大數據是指具有海量(volume)、多模態(variety)、變化速度快(velocity)、蘊含價值高(value)和不精確性高(veracity)“5V”特徵的數據。大...
開源大數據 1. Hadoop HDFS、Hadoop MapReduce, HBase、Hive、Spark、Flink 漸次誕生,早期Hadoop生態圈逐步形成。2. Hypertable是另類。它存在於Hadoop生態圈之外,但也曾經有一些用戶。一體機數據倉庫 IBM PureData(Netezza), Oracle...
當下Spark已不止步於實時計算,目標直指通用大數據處理平台,而終止Spark,開啟SparkSQL或許已經初見端倪。大數據機器學習和數據挖掘的並行化算法研究成為大數據領域一個較為重要的研究熱點。早幾年國內外研究者和業界比較關注的是在 Hadoop ...
《大數據技術入門——Hadoop+Spark》是2022年清華大學出版社出版的圖書,作者是于海浩、劉志坤主編、韓詠、孫栩副主編。 內容簡介 本書基礎理論、套用開發以及實際案例相結合,圍繞Hadoop、Spark生態圈循序漸進地介紹關於大數據技術領域中的基...
《大數據技術入門到商業實戰Hadoop+Spark+Flink全解析》是2021年機械工業出版社出版的圖書。本書全面詳細地介紹了大數據生態系統中的主流技術。全書共10章,主要包括大數據生態系統概述、大數據採集技術、大數據存儲技術、大數據分析處理技術等...
《Spark大數據分析——源碼解析與實例詳解》是2019年7月電子工業出版社出版的圖書,作者是劉景澤。 內容簡介 講解了網路大數據時代應運而生的、能高效迅捷地分析處理數據的工具——Spark,它帶領讀者快速掌握用 Spark 收集、計算、簡化...
《Spark大數據分析》是2017年機械工業出版社出版的圖書,作者是穆罕默德·古勒。內容簡介 本書是關於大數據和Spark的一個簡明手冊。它將助你學習如何用Spark來完成很多大數據分析任務,其中覆蓋了高效利用Spark所需要知道的重要主題:如何使用...
《Spark大數據分析:源碼解析與實例詳解》基於Spark 2.3.x、Spark 2.4.x系列版本,採用“理論+實踐”的形式編寫。全書共有90個實例,1個完整項目。內容提要 《Spark大數據分析:源碼解析與實例詳解》結構清晰、實例豐富、通俗易懂、實用...
全書包含13章: 第1、2章介紹如何為深入學習Hadoop和Spark做環境準備,包括VMware虛擬機的創建和CentOS作業系統安裝。第3~6章介紹Hadoop大數據平台的基本原理,包括HDFS、MapReduce計算模型、HBase資料庫,以及Hive數據倉庫的原理、部署方法和...
有多年企業軟體研發經驗和豐富的JavaEE、大數據技術培訓經驗,熟練掌握JavaEE與大數據全棧技術框架,擅長JavaEE系統架構設計、大數據分析與挖掘。著有圖書《Hive入門與大數據分析實戰》《Hadoop大數據分析技術》《Hadoop+Spark大數據分析實戰》《...
本書從Hadoop的原理和使用出發,在重點介紹Hadoop生態系統的重要組件HDFS、MapReduce、YARN、Hive和Spark的同時,注重大數據分析能力的全面提高。本書共分13章,主要內容包括Hadoop簡介、HDFS檔案系統、YARN資源管理、MapReduce計算框架、Hive...
《Spark大數據分析技術與實戰》一書由經管之家 主編,董軼群、曹正鳳、趙仁乾、王安 編著,電子工業出版社2017年7月出版 內容提要 Spark作為下一代大數據處理引擎,經過短短几年的飛躍式發展,正在以燎原之勢席捲業界,現已成為大數據產業...
《Spark大數據實時分析實戰》是2020年北京理工大學出版社出版的圖書。內容簡介 《Spark大數據實時分析實戰》分為六個項目,通過真實大數據實時分析項目的導入,引導讀者完成大數據實時分析平台Spark的搭建,通過對基於Hadoop生態圈中Yarn資源調度...
《Spark 3.x大數據分析實戰(視頻教學版)》是2022年清華大學出版社出版的圖書,作者是張偉洋。內容簡介 本書基於Spark 3.2.x版本,從Spark核心程式語言Scala講起,涵蓋了當前整個Spark生態系統主流的大數據開發技術。全書共9章,第1章...
1.1.3大數據思維2 1.2代表性大數據技術3 1.2.1Hadoop3 1.2.2Spark5 1.2.3Flink5 1.3大數據程式語言5 1.4線上資源5 1.5拓展閱讀——三次信息化浪潮的啟示6 1.6習題6 第2章Spark大數據處理框架7 2.1Spark概述7 2.1....
《Spark快速大數據分析》是2021年人民郵電出版社出版的圖書,作者是[美] 卡勞 ( HoldenKarau )、 [美] 肯維尼斯科 ( Andy Konwinski )、[美] 溫德爾 ( PatrickWendell ) 、[加] 扎哈里亞 ( Matei Zaharia )。內容簡介 ...
《Hadoop權威指南:大數據的存儲與分析(第4版)》是2017年7月清華大學出版社出版的圖書,作者是Tom White。內容簡介 本書結合理論和實踐,由淺入深,全方位介紹了Hadoop這一高性能的海量數據處理和分析平台。全書5部分24章,第Ⅰ部分...
《Hadoop & Spark大數據開發實戰》是2017年中國水利水電出版社出版的圖書,作者是肖睿、雷剛躍、宋麗萍、張宇、彭英。內容簡介 大數據讓我們以一種前所未有的方式,通過對海量數據進行分析,獲得有巨大價值的產品和服務,*終形成變革之力...
大數據技術讓我們以一種前所未有的方式,對海量數據進行分析,從中獲得有巨大價值的產品和服務,*終形成變革之力。本書圍繞Hadoop和Spark兩個主流大數據技術進行講解,主要內容包括Hadoop環境配置、Hadoop分散式檔案系統(HDFS)、Hadoop分散式...
本書詳細闡述了與Hadoop 3大數據分析相關的基本解決方案,主要包括Hadoop簡介、大數據分析概述、基於MapReduce的大數據處理、Python-Hadoop科學計算和大數據分析、R-Hadoop統計數據計算、Apache Spark批處理分析、Apache Spark實時數據分析、Apache ...
第4章 Spark大數據處理基礎 69 4.1 Spark大數據處理技術 69 4.1.1 Spark系統概述 69 4.1.2 Spark生態系統BDAS(伯利克分析棧) 70 4.1.3 Spark的用武之地 71 4.1.4 Spark大數據處理框架 72 4.1.5 Spark運行模式分類及...
《圖解Spark 大數據快速分析實戰》是2022年人民郵電出版社出版的圖書。內容簡介 本書共8章,內容主要包括Spark概述及入門實戰,Spark的作業調度和資源分配算法,Spark SQL、DataFrame、Dataset的原理和實戰,深入理解Spark數據源,流式計算的...
1.1.1 大數據與Hadoop簡史 4 1.1.2 Hadoop詳解 5 1.2 Apache Spark簡介 11 1.2.1 Apache Spark背景 11 1.2.2 Spark的用途 12 1.2.3 Spark編程接口 12 1.2.4 Spark程式的提交類型 12 1.2.5 Spark應用程式的...
Spark亞太研究院院長和首席專家,移動網際網路、雲計算和大數據技術領域技術集大成者。在Spark、Hadoop、Android、Docker等方面有豐富的源碼、實務和性能最佳化經驗。徹底研究了Spark從0.5.0到1.1.0共18個版本的Spark源碼,電子書《Spark+...