《Spark大數據處理與分析》是2020年清華大學出版社出版的圖書,作者是雷擎。
基本介紹
- 中文名:Spark大數據處理與分析
- 作者:雷擎
- 出版時間:2020年11月1日
- 出版社:清華大學出版社
- ISBN:9787302560777
《Spark大數據處理與分析》是2020年清華大學出版社出版的圖書,作者是雷擎。
Bagel: Pregel on Spark,可以用Spark進行圖計算,這是個非常有用的小項目。Bagel自帶了一個例子,實現了Google的PageRank算法。當下Spark已不止步於實時計算,目標直指通用大數據處理平台,而終止Spark,開啟SparkSQL或許已經初見端倪。大數據...
《Spark大數據分析——源碼解析與實例詳解》是2019年7月電子工業出版社出版的圖書,作者是劉景澤。 內容簡介 講解了網路大數據時代應運而生的、能高效迅捷地分析處理數據的工具——Spark,它帶領讀者快速掌握用 Spark 收集、計算、簡化...
《Spark大數據分析:源碼解析與實例詳解》基於Spark 2.3.x、Spark 2.4.x系列版本,採用“理論+實踐”的形式編寫。全書共有90個實例,1個完整項目。內容提要 《Spark大數據分析:源碼解析與實例詳解》結構清晰、實例豐富、通俗易懂、實用...
《Spark大數據分析技術(Python版·微課版)》是2023年清華大學出版社出版的圖書,作者是曹潔。內容簡介 本書系統介紹Spark大數據處理框架。全書共8章,內容包括大數據技術概述、Spark大數據處理框架、Spark RDD編程、Spark SQL結構化數據處理、...
Spark是當前主流的大數據計算框架,本書較為全面地介紹了Spark的基本知識。按照“項目驅動、任務導向”的理念,全書設計了七個項目,分別是搭建Spark環境、編寫Scala程式處理4S店數據、Spark RDD分析交通違章記錄、Spark SQL處理結構化學生信息...
《Spark入門與大數據分析實戰》是清華大學出版社出版的一本書,作者是遲殿委。內容簡介 本書基於Spark 3.3.1框架展開,系統介紹Spark生態系統各組件的操作,以及相應的大數據分析方法。《Spark入門與大數據分析實戰》各章節均提供豐富的示例...
Spark作為下一代大數據處理引擎,經過短短几年的飛躍式發展,正在以燎原之勢席捲業界,現已成為大數據產業中的一股中堅力量。《Spark大數據分析技術與實戰》著重講解了Spark核心、Spark GraphX、Spark SQL、Spark Streaming和Spark MLlib的...
《Spark大數據分析》是2017年機械工業出版社出版的圖書,作者是穆罕默德·古勒。內容簡介 本書是關於大數據和Spark的一個簡明手冊。它將助你學習如何用Spark來完成很多大數據分析任務,其中覆蓋了高效利用Spark所需要知道的重要主題:如何使用...
《Spark大數據分析與實戰》是2019年9月清華大學出版社出版的圖書,作者是黑馬程式設計師。內容簡介 本書從初學者角度詳細介紹了Spark應用程式體系架構的核心技術,全書共9章。第1章詳細介紹開發Spark框架的Scala程式語言;第2~4、7~8章主要...
《Spark 3.0大數據分析與挖掘:基於機器學習》是清華大學出版社出版的一本圖書,作者是王曉華 羅凱靖。內容簡介 Spark作為新興的、套用範圍廣泛的大數據處理開源框架,吸引了大量的大數據分析與挖掘從業人員進行相關內容的學習與開發,其中ML...
《Spark大數據處理》是清華大學出版社出版的圖書,作者是劉軍,林文輝,方澄 內容簡介 劉軍, 男,1976年生人,博士,副教授,碩士生導師,北京郵電大學數據科學中心主任。2003年至2007年任職於IBM中國研究院,擔任高級研究員及部門經理,...
本書由 Spark 開發者及核心成員共同打造,講解了網路大數據時代應運而生的、能高效迅捷地分析處理數據的工具——Spark,它帶領讀者快速掌握用 Spark 收集、計算、簡化和保存海量數據的方法,學會互動、疊代和增量式分析,解決分區、數據本...
而由此產生的推薦、社交網路分析、位置預測等問題將涉及數據挖掘、機器學習、圖計算等方面的技術。因此,基於位置服務的移動社交網路大數據的分散式數據管理和數據分析的解決方案,則成為了目前諸多套用中亟待解決的問題。Spark作為新一代處理...
Apache Spark 是一套分散式和高擴展性的數據分析系統,在大數據分析乃至於計器學習的套用上占有一席之地。為了因應數據量爆炸性的成長,Spark 也不斷擴充其功能模組,提供更具效率的數據分析與處理流程,也因此造成許多開發者對於 Spark 各...
《Spark大數據處理技術》是2015年1月電子工業出版社出版的圖書,作者是夏俊鸞、程浩、邵賽賽。內容簡介 本書以Spark 0.9版本為基礎進行編寫,是一本全面介紹Spark及Spark生態圈相關技術的書籍,是國內首本深入介紹 Spark 原理和架構的技術...
《spark大數據處理技術》是機械工業出版社2021年7月出版的書籍。內容簡介 本書通過兩個基本項目介紹了Scala語言的基本語法、函式式編程、高階函式、模式匹配等相關知識和技術;通過12個實訓項目,介紹了Spark的技術棧,內容涵蓋Spark Core、...
《Spark 3.x大數據分析實戰(視頻教學版)》是2022年清華大學出版社出版的圖書,作者是張偉洋。內容簡介 本書基於Spark 3.2.x版本,從Spark核心程式語言Scala講起,涵蓋了當前整個Spark生態系統主流的大數據開發技術。全書共9章,第1章...
《Spark快速大數據分析第2版》是2021年人民郵電出版社出版的圖書,作者是[美] 朱爾斯·S.達米吉、[美] 布魯克·韋尼希、[印] 泰瑟加塔·達斯、[美] 丹尼·李。內容簡介 本書的主角是在大數據時代應運而生的數據處理與分析利器——...
《Spark實時大數據分析——基於Spark Streaming框架》是2018年清華大學出版社出版的圖書,作者是(美)祖貝爾·納比。 內容簡介 本書詳細闡述了與Spark實時大數據分析以及Spark Streaming框架相關的基本解決方案,主要包括大數據漫遊指南,實時RDD...
《圖解Spark 大數據快速分析實戰》是2022年人民郵電出版社出版的圖書。內容簡介 本書共8章,內容主要包括Spark概述及入門實戰,Spark的作業調度和資源分配算法,Spark SQL、DataFrame、Dataset的原理和實戰,深入理解Spark數據源,流式計算的...
《Scala和Spark大數據分析函式式編程、數據流和機器學習》是2020年6月1日清華大學出版社出版的圖書,作者是雷扎爾·卡里姆(Md.、Rezaul、Karim)、斯里達爾·阿拉(SridharAl la)。作者介紹 Md. Rezaul Karim 是德國Fraunhofer FIT的研究...
第一部分 Spark基礎 第1章 大數據、Hadoop、Spark介紹 2 1.1 大數據、分散式計算、Hadoop簡介 2 1.1.1 大數據與Hadoop簡史 2 1.1.2 Hadoop簡介 3 1.2 Spark簡介 8 1.2.1 Spark背景 9 1.2.2 Spark的用途 9 1.2....
《Spark大數據實時分析實戰》適用於大數據技術與套用、數據科學與大數據技術等電子信息類專業教學的教材,也可作為工程技術人員的參考書。圖書目錄 項目一 初識Spark技術 任務1.1 數據處理系統 1.1.1 數據存儲技術 1.1.2 數據分析...
《Spark大數據處理: 原理、算法與實例》是2016年9月清華大學出版社出版的圖書,作者是劉軍、林文輝、方澄。內容簡介 本書以時下最為流行的Hadoop所存在的缺陷為出發點,深入淺出地介紹了下一代大數據處理核心技術Spark的優勢和必要性,並...
本書重點關注Spark項目的基本知識,從Spark核心開始,然後拓展到各種Spark擴展、Spark相關項目、Spark子項目,以及Spark所處的豐富的生態系統里各種別的開源技術,比如Hadoop、Kafka、Cassandra等。圖書目錄 第一部分 Spark基礎 第1章 大數據...
第二部分實現了一個企業背景調查系統,比較新穎的是,該系統借鑑了數據湖與Lambda架構的思想,涵蓋了批處理、流處理套用開發,並加入了一些開源組件來滿足需求,既是對本書第一部分很好的鞏固,又完整呈現了一個實時大數據套用的開發過程。
《Spark與Hadoop大數據分析》是2017年機械工業出版社出版的圖書。內容簡介 本書介紹了ApacheSpark和Hadoop的基礎知識,並深入探討了所有Spark組件:SparkCore、SparkSQL、DataFrame、DataSet、普通流、結構化流、MLlib、Graphx,以及Hadoop的核心...
他在端到端的生命周期方案及在雲環境(Azure、AWS和GCP)中設計、開發和部署生產級大數據分析解決方案架構方面擁有豐富經驗,這些環境支持廣泛的業務案例(包括數據湖、可伸縮預測和圖形分析、流處理)等。他的經驗延伸到大數據分析的DevOps...
《Hadoop + Spark 大數據巨量分析與機器學習整合開發實戰》是2017年清華大學出版社出版的圖書,作者是林大貴。前言 大數據的影響力正深入到各個領域和行業中。特別在商業、經濟以及其他領域,將大量數據進行分析後,便可得到許多數據的關聯性...