《Spark大數據處理》是清華大學出版社出版的圖書,作者是劉軍,林文輝,方澄
基本介紹
- ISBN:9787302449959
- 作者:劉軍、林文輝、方澄
- 出版社:清華大學出版社
- 出版時間:2016年9月
- 頁數:199
《Spark大數據處理》是清華大學出版社出版的圖書,作者是劉軍,林文輝,方澄
《大數據處理框架Apache Spark設計與實現(全彩)》由電子工業出版社於2020年8月出版,作者是許利傑,方亞芬。本書採用問題驅動的敘述方式,強調基本原理的闡述,內容紮實,深入Spark底層。內容簡介 《大數據處理框架Apache Spark設計與實現(...
《Spark大數據處理技術》是2015年1月電子工業出版社出版的圖書,作者是夏俊鸞、程浩、邵賽賽。內容簡介 本書以Spark 0.9版本為基礎進行編寫,是一本全面介紹Spark及Spark生態圈相關技術的書籍,是國內首本深入介紹 Spark 原理和架構的技術...
《Spark海量數據處理:技術詳解與平台實戰》是2019年12月人民郵電出版社出版的圖書,作者是范東來。內容簡介 本書基於Spark發行版2.4.4寫作而成,包含大量的實例與一個完整項目,層次分明,循序漸進。全書分為3部分,涵蓋了技術理論與實戰...
Spark是當今大數據領域最活躍、最熱門、最高效的大數據通用計算平台,是Apache軟體基金會下所有開源項目中三大頂級開源項目之一。內容簡介 在“One Stack to rule them all”理念的指引下,Spark基於RDD成功地構建起了大數據處理的一體化解決...
《Spark大數據處理:技術、套用與性能最佳化》是機械工業出版社出版的圖書,作者是高彥傑 內容簡介 《Spark大數據處理:技術、套用與性能最佳化》根據最新技術版本,系統、全面、詳細講解Spark的各項功能使用、原理機制、技術細節、套用方法、性能...
《spark大數據處理技術》是機械工業出版社2021年7月出版的書籍。內容簡介 本書通過兩個基本項目介紹了Scala語言的基本語法、函式式編程、高階函式、模式匹配等相關知識和技術;通過12個實訓項目,介紹了Spark的技術棧,內容涵蓋Spark Core、...
《Spark大數據處理: 原理、算法與實例》是2016年9月清華大學出版社出版的圖書,作者是劉軍、林文輝、方澄。內容簡介 本書以時下最為流行的Hadoop所存在的缺陷為出發點,深入淺出地介紹了下一代大數據處理核心技術Spark的優勢和必要性,並...
《Spark大數據處理與分析》是2020年清華大學出版社出版的圖書,作者是雷擎。內容簡介 本書是Spark技術入門的基礎類書籍,通過本書的學習實驗可以牢固掌握Spark編程技術的基本概念、原理和編程方法,能夠進行應用程式的實際開發。圖書目錄 第1...
Spark是一個開源的通用並行分散式計算框架,由加州大學伯克利分校的AMP實驗室開發,支持記憶體計算、多疊代批量處理、即席查詢、流處理和圖計算等多種範式。Spark記憶體計算框架適合各種疊代算法和互動式數據分析,能夠提升大數據處理的實時性和準確...
第二部分Spark大數據處理框架的核心理論(第3~4章):介紹Spark框架將應用程式轉化為邏輯處理流程,進而轉化為可並行執行的物理執行計畫的一般過程及方法。第三部分典型的Spark套用(第5章):介紹疊代型的Spark機器學習套用和圖計算套用。...
《Spark大數據分析——源碼解析與實例詳解》是2019年7月電子工業出版社出版的圖書,作者是劉景澤。 內容簡介 講解了網路大數據時代應運而生的、能高效迅捷地分析處理數據的工具——Spark,它帶領讀者快速掌握用 Spark 收集、計算、簡化...
《Spark大數據分析技術(Python版·微課版)》是2023年清華大學出版社出版的圖書,作者是曹潔。內容簡介 本書系統介紹Spark大數據處理框架。全書共8章,內容包括大數據技術概述、Spark大數據處理框架、Spark RDD編程、Spark SQL結構化數據處理、...
《雲計算環境下Spark大數據處理技術與實踐》是2017年9月清華大學出版社出版的圖書,作者是鄧立國、佟強。內容簡介 本書圍繞網際網路重大的技術革命:雲計算、大數據進行闡述。雲計算環境下大數據處理構建是國民經濟發展的信息基礎設施,發展自主...
《Spark大數據分析技術與實戰》一書由經管之家 主編,董軼群、曹正鳳、趙仁乾、王安 編著,電子工業出版社2017年7月出版 內容提要 Spark作為下一代大數據處理引擎,經過短短几年的飛躍式發展,正在以燎原之勢席捲業界,現已成為大數據產業...
《Spark Streaming實時流式大數據處理實戰》是2019年4月機械工業出版社出版的圖書,作者是肖力濤 。內容簡介 本書以翔實的原理講解和充實的實戰代碼剖析,全面闡述了Spark Streaming流式處理平台,便於讀者能夠從入門開始了解搭建Spark平台,在...
Spark作為新一代處理大數據的平台,在疊代計算、數據流、互動式數據挖掘以及圖計算等方面具有比Hadoop更高的運算效率和更好的容錯性。因此,本課題以研究移動社交網路大數據為對象,以Spark為計算大數據的平台,重點解決基於位置服務的社交網路...
第3篇 Spark技術 第12章 Spark概述 213 12.1 Spark框架原理 213 12.2 Spark大數據處理 214 12.3 RDD數據集 215 12.4 Spark子系統 215 第13章 Scala語言 216 13.1 Scala語法基礎 216 13.1.1 變數、常量與賦值 216 13.1....
14.6 小結 第15章 服務層與查詢層 15.1 不僅僅是合併 15.2 接口開發 15.3 小結 第三部分 總結篇 第16章 總結和展望 16.1 統一的大數據處理接口 16.2 Kappa架構 16.3 大數據處理技術 16.4 Spark未來發展方向 ...
Apache Spark 是一套分散式和高擴展性的數據分析系統,在大數據分析乃至於計器學習的套用上占有一席之地。為了因應數據量爆炸性的成長,Spark 也不斷擴充其功能模組,提供更具效率的數據分析與處理流程,也因此造成許多開發者對於 Spark 各...
Hadoop+Spark+Python大數據處理從算法到實戰 《Hadoop+Spark+Python大數據處理從算法到實戰》是2021年北京大學出版社出版的圖書。
《企業大數據處理》是2017年機械工業出版社出版的圖書,作者是肖冠宇。內容簡介 這是一本立足於企業真實的商用項目來講解如何高效從事大數據實踐的著作。技術層面,從全棧的角度系統梳理和詳盡講解了大數據的核心技術,包括Spark、Druid、Flume...
它將助你學習如何用Spark來完成很多大數據分析任務,其中覆蓋了高效利用Spark所需要知道的重要主題:如何使用SparkShell進行互動式數據分析、如何編寫Spark套用、如何在Spark中對大規模數據進行互動分析、如何使用SparkStreaming處理高速數據流、...
Spark是當前主流的大數據計算框架,本書較為全面地介紹了Spark的基本知識。按照“項目驅動、任務導向”的理念,全書設計了七個項目,分別是搭建Spark環境、編寫Scala程式處理4S店數據、Spark RDD分析交通違章記錄、Spark SQL處理結構化學生信息...
《Spark與Hadoop大數據分析》是2017年機械工業出版社出版的圖書。內容簡介 本書介紹了ApacheSpark和Hadoop的基礎知識,並深入探討了所有Spark組件:SparkCore、SparkSQL、DataFrame、DataSet、普通流、結構化流、MLlib、Graphx,以及Hadoop的核心...
本書由 Spark 開發者及核心成員共同打造,講解了網路大數據時代應運而生的、能高效迅捷地分析處理數據的工具——Spark,它帶領讀者快速掌握用 Spark 收集、計算、簡化和保存海量數據的方法,學會互動、疊代和增量式分析,解決分區、數據本...
第2~4、7~8章主要講解Spark核心基礎、SparkRDD彈性分散式數據集、Spark SQL處理結構化數據、Spark Streaming實時計算框架、Spark MLlib機器學習庫,並包含了搭建Spark集群、Spark集群的操作方式、利用Spark解決大數據工作中遇到的基本問題。
《Spark 3.x大數據分析實戰(視頻教學版)》是2022年清華大學出版社出版的圖書,作者是張偉洋。內容簡介 本書基於Spark 3.2.x版本,從Spark核心程式語言Scala講起,涵蓋了當前整個Spark生態系統主流的大數據開發技術。全書共9章,第1章...
在大數據開發中,大數據處理是其中十分關鍵、必不可少的一環。Spark 是主流的通用大數據處理平台,因此,要學習大數據開發,必然要學習 Spark。近年來,編者在大數據教學上,尤其是在 Spark 技術的套用和推廣上進行了一系列有益的嘗試。在...
2.4 大數據處理系統Spark 95 2.4.1 什麼是Spark 95 2.4.2 Spark的運行架構 96 2.4.3 Spark的工作機制 97 第3章 Hadoop分散式檔案系統HDFS 106 3.1 HDFS概述 106 3.1.1 HDFS的優勢 106 3.1.2 HDFS的局限性 107 3.2...