《Spark大數據分析》是2017年機械工業出版社出版的圖書,作者是穆罕默德·古勒。
基本介紹
- 中文名:Spark大數據分析
- 作者:穆罕默德·古勒
- 出版社:機械工業出版社
- 出版時間:2017年5月
- 開本:16 開
- ISBN:9787111565611
《Spark大數據分析》是2017年機械工業出版社出版的圖書,作者是穆罕默德·古勒。
《Spark大數據分析——源碼解析與實例詳解》是2019年7月電子工業出版社出版的圖書,作者是劉景澤。 內容簡介 講解了網路大數據時代應運而生的、能高效迅捷地分析處理數據的工具——Spark,它帶領讀者快速掌握用 Spark 收集、計算、簡化...
《Spark大數據分析》是2017年機械工業出版社出版的圖書,作者是穆罕默德·古勒。內容簡介 本書是關於大數據和Spark的一個簡明手冊。它將助你學習如何用Spark來完成很多大數據分析任務,其中覆蓋了高效利用Spark所需要知道的重要主題:如何使用...
第2章Spark基礎33 2.1初識Spark33Spark大數據分析與實戰 2.1.1Spark概述33 2.1.2Spark的特點34 2.1.3Spark套用場景35 2.1.4Spark與Hadoop對比36 2.2搭建Spark開發環境37 2.2.1環境準備37 2.2.2Spark的部署方式37 2.2.3...
Spark是當前主流的大數據計算框架,本書較為全面地介紹了Spark的基本知識。按照“項目驅動、任務導向”的理念,全書設計了七個項目,分別是搭建Spark環境、編寫Scala程式處理4S店數據、Spark RDD分析交通違章記錄、Spark SQL處理結構化學生信息...
《Spark大數據分析技術(Python版·微課版)》是2023年清華大學出版社出版的圖書,作者是曹潔。內容簡介 本書系統介紹Spark大數據處理框架。全書共8章,內容包括大數據技術概述、Spark大數據處理框架、Spark RDD編程、Spark SQL結構化數據處理、...
有多年企業軟體研發經驗和豐富的JavaEE、大數據技術培訓經驗,熟練掌握JavaEE與大數據全棧技術框架,擅長JavaEE系統架構設計、大數據分析與挖掘。著有圖書《Hive入門與大數據分析實戰》《Hadoop大數據分析技術》《Hadoop+Spark大數據分析實戰》《...
《Spark快速大數據分析》是2021年人民郵電出版社出版的圖書,作者是[美] 卡勞 ( HoldenKarau )、 [美] 肯維尼斯科 ( Andy Konwinski )、[美] 溫德爾 ( PatrickWendell ) 、[加] 扎哈里亞 ( Matei Zaharia )。內容簡介 ...
《Spark 3.x大數據分析實戰(視頻教學版)》是2022年清華大學出版社出版的圖書,作者是張偉洋。內容簡介 本書基於Spark 3.2.x版本,從Spark核心程式語言Scala講起,涵蓋了當前整個Spark生態系統主流的大數據開發技術。全書共9章,第1章...
Spark作為下一代大數據處理引擎,經過短短几年的飛躍式發展,正在以燎原之勢席捲業界,現已成為大數據產業中的一股中堅力量。《Spark大數據分析技術與實戰》著重講解了Spark核心、Spark GraphX、Spark SQL、Spark Streaming和Spark MLlib的...
第1章 Spark大數據分析概述 1 1.1 大數據時代 1 1.2 大數據分析的要素 2 1.3 簡單、優雅、有效—這就是Spark 3 1.4 Spark 3.0核心—ML 4 1.5 星星之火,可以燎原 6 1.6 小結 6 第2章 Spark 3.0安裝和...
《Spark大數據分析實戰》是清華大學出版社出版的一本圖書,作者是張偉洋。內容介紹 本書作為Spark的入門書,從Spark核心程式語言Scala講起,涵蓋當前Spark主流的開發組件。以實操為主,深入講解每一個操作步驟,包括Spark RDD離線數據處理、...
《Spark快速大數據分析第2版》是2021年人民郵電出版社出版的圖書,作者是[美] 朱爾斯·S.達米吉、[美] 布魯克·韋尼希、[印] 泰瑟加塔·達斯、[美] 丹尼·李。內容簡介 本書的主角是在大數據時代應運而生的數據處理與分析利器——...
5.6案例分析255 5.6.1探索數據256 5.6.2創建數據流260 5.6.3轉換操作267 5.6.4視窗操作268 5.7小結271 〖1〗Spark大數據處理與分析目錄〖3〗〖3〗第6章分散式的圖處理/272 6.1理解圖的概念272 6.2圖並行系統276 6.3...
《Spark大數據實時分析實戰》是2020年北京理工大學出版社出版的圖書。內容簡介 《Spark大數據實時分析實戰》分為六個項目,通過真實大數據實時分析項目的導入,引導讀者完成大數據實時分析平台Spark的搭建,通過對基於Hadoop生態圈中Yarn資源調度...
《圖解Spark 大數據快速分析實戰》是2022年人民郵電出版社出版的圖書。內容簡介 本書共8章,內容主要包括Spark概述及入門實戰,Spark的作業調度和資源分配算法,Spark SQL、DataFrame、Dataset的原理和實戰,深入理解Spark數據源,流式計算的...
等等,當要處理的數據規模達到大數據等級時,就不再是單機的 R 或 Python 可以應付得來的。 Apache Spark 是一套分散式和高擴展性的數據分析系統,在大數據分析乃至於計器學習的套用上占有一席之地。為了因應數據量爆炸性的成長,Spark ...
《Scala和Spark大數據分析函式式編程、數據流和機器學習》是2020年6月1日清華大學出版社出版的圖書,作者是雷扎爾·卡里姆(Md.、Rezaul、Karim)、斯里達爾·阿拉(SridharAl la)。作者介紹 Md. Rezaul Karim 是德國Fraunhofer FIT的研究...
《Spark實時大數據分析——基於Spark Streaming框架》是2018年清華大學出版社出版的圖書,作者是(美)祖貝爾·納比。 內容簡介 本書詳細闡述了與Spark實時大數據分析以及Spark Streaming框架相關的基本解決方案,主要包括大數據漫遊指南,實時RDD...
《Hadoop+Spark大數據分析實戰》是清華大學出版社於2022年出版的書籍,作者是遲殿委。內容簡介 本書是Hadoop + Spark大數據分析技術入門書,基於Hadoop和Spark兩大框架體系的3.2版本,以通俗易懂的方式介紹Hadoop + Spark原生態組件的原理、...
《Hadoop + Spark 大數據巨量分析與機器學習整合開發實戰》是2017年清華大學出版社出版的圖書,作者是林大貴。前言 大數據的影響力正深入到各個領域和行業中。特別在商業、經濟以及其他領域,將大量數據進行分析後,便可得到許多數據的關聯性...
《Spark與Hadoop大數據分析》是2017年機械工業出版社出版的圖書。內容簡介 本書介紹了ApacheSpark和Hadoop的基礎知識,並深入探討了所有Spark組件:SparkCore、SparkSQL、DataFrame、DataSet、普通流、結構化流、MLlib、Graphx,以及Hadoop的核心...
(類似dplyr包中的功能)這很好的解決了R的大數據級瓶頸問題。 SparkR也支持分散式的機器學習算法,比如使用MLib機器學習庫。SparkR為Spark引入了R語言社區的活力,吸引了大量的數據科學家開始在Spark平台上直接開始數據分析之旅。基本原理 ...
第一部分 Spark基礎 第1章 大數據、Hadoop、Spark介紹 2 1.1 大數據、分散式計算、Hadoop簡介 2 1.1.1 大數據與Hadoop簡史 2 1.1.2 Hadoop簡介 3 1.2 Spark簡介 8 1.2.1 Spark背景 9 1.2.2 Spark的用途 9 1.2....
第4章 Spark大數據處理基礎 69 4.1 Spark大數據處理技術 69 4.1.1 Spark系統概述 69 4.1.2 Spark生態系統BDAS(伯利克分析棧) 70 4.1.3 Spark的用武之地 71 4.1.4 Spark大數據處理框架 72 4.1.5 Spark運行模式分類及...
第 1章 大數據分析 1 1.1 數據科學面臨的挑戰 2 1.2 認識Apache Spark 4 1.3 關於本書 5 1.4 第 2版說明 6 第 2章 用Scala 和Spark 進行數據分析 8 2.1 數據科學家的Scala 9 2.2 Spark編程模型 10 2...
開源大數據 1. Hadoop HDFS、Hadoop MapReduce, HBase、Hive、Spark、Flink 漸次誕生,早期Hadoop生態圈逐步形成。2. Hypertable是另類。它存在於Hadoop生態圈之外,但也曾經有一些用戶。一體機數據倉庫 IBM PureData(Netezza), Oracle...
《實時大數據分析——基於Storm、Spark技術的實時套用》是2018年1月清華大學出版社出版的圖書,作者是[美]Sumit Gupta、Shilpi Saxena。內容簡介 本書詳細闡述了實時大數據分析的實現過程,主要包括大數據技術前景及分析平台;熟悉Storm平台;...
《Spark大數據處理技術》是2015年1月電子工業出版社出版的圖書,作者是夏俊鸞、程浩、邵賽賽。內容簡介 本書以Spark 0.9版本為基礎進行編寫,是一本全面介紹Spark及Spark生態圈相關技術的書籍,是國內首本深入介紹 Spark 原理和架構的技術...