《Spark大數據分析與實戰》是2019年9月清華大學出版社出版的圖書,作者是黑馬程式設計師。
基本介紹
- 書名:Spark大數據分析與實戰
- 作者:黑馬程式設計師
- 出版社:清華大學出版社
- 出版時間:2019年9月
- 定價:49 元
- ISBN:9787302534327
《Spark大數據分析與實戰》是2019年9月清華大學出版社出版的圖書,作者是黑馬程式設計師。
《Spark大數據分析技術與實戰》著重講解了Spark核心、Spark GraphX、Spark SQL、Spark Streaming和Spark MLlib的核心概念與理論框架,並提供了相應的示例與解析。《Spark大數據分析技術與實戰》共分為8章,其中前4章介紹Spark核心,主要包括Spark簡介、集群部署、工作原理、核心概念與操作等;後4章分別介紹Spark核心的核心...
《Spark大數據分析與實戰》是2019年9月清華大學出版社出版的圖書,作者是黑馬程式設計師。內容簡介 本書從初學者角度詳細介紹了Spark應用程式體系架構的核心技術,全書共9章。第1章詳細介紹開發Spark框架的Scala程式語言;第2~4、7~8章主要講解Spark核心基礎、SparkRDD彈性分散式數據集、Spark SQL處理結構化數據、Spark ...
《Spark入門與大數據分析實戰》是由遲殿委和李超共同撰寫,清華大學出版社出版的圖書。內容簡介 本書基於Spark 3.3.1框架展開,系統介紹Spark生態系統各組件的操作,以及相應的大數據分析方法。《Spark入門與大數據分析實戰》各章節均提供豐富的示例及其詳細的操作步驟,並配套示例源碼、PPT課件和教學大綱。本書共分11章,...
《Spark大數據分析實戰》是清華大學出版社出版的一本圖書,作者是張偉洋。內容介紹 本書作為Spark的入門書,從Spark核心程式語言Scala講起,涵蓋當前Spark主流的開發組件。以實操為主,深入講解每一個操作步驟,包括Spark RDD離線數據處理、Spark SQL快速結構化數據處理、Spark Streaming實時數據處理,同時包括案例講解、源碼...
《圖解Spark 大數據快速分析實戰》是2022年人民郵電出版社出版的圖書。內容簡介 本書共8章,內容主要包括Spark概述及入門實戰,Spark的作業調度和資源分配算法,Spark SQL、DataFrame、Dataset的原理和實戰,深入理解Spark數據源,流式計算的原理和實戰,億級數據處理平台Spark性能調優,Spark機器學習庫,Spark 3.0的新特性...
《Spark 2.x 大數據分析與機器學習實戰》是旗標出版的圖書,作者是Romeo Kienzler 內容簡介 身處於信息爆炸的時代,數據無時無刻不間斷產生,大型購物網站的會員數據、工廠大規模的感測器數據…等等,當要處理的數據規模達到大數據等級時,就不再是單機的 R 或 Python 可以應付得來的。 Apache Spark 是一套分散式和...
《Spark大數據實時分析實戰》是2020年北京理工大學出版社出版的圖書。內容簡介 《Spark大數據實時分析實戰》分為六個項目,通過真實大數據實時分析項目的導入,引導讀者完成大數據實時分析平台Spark的搭建,通過對基於Hadoop生態圈中Yarn資源調度框架,搭建Spark日誌管理系統,搭建Kafka分散式訊息系統,在工作中實現使用Spark...
《Spark 3.x大數據分析實戰(視頻教學版)》是2022年清華大學出版社出版的圖書,作者是張偉洋。內容簡介 本書基於Spark 3.2.x版本,從Spark核心程式語言Scala講起,涵蓋了當前整個Spark生態系統主流的大數據開發技術。全書共9章,第1章講解了Scala語言的基礎知識,包括IDEA工具的使用等;第2章講解了Spark的主要組件、...
Spark是當今大數據領域最活躍、最熱門、最高效的大數據通用計算平台,是Apache軟體基金會下所有開源項目中三大頂級開源項目之一。內容簡介 在“One Stack to rule them all”理念的指引下,Spark基於RDD成功地構建起了大數據處理的一體化解決方案,將MapReduce、Streaming、SQL、Machine Learning、Graph Processing等大數據計算...
《Hadoop+Spark大數據分析實戰》是清華大學出版社於2022年出版的書籍,作者是遲殿委。內容簡介 本書是Hadoop + Spark大數據分析技術入門書,基於Hadoop和Spark兩大框架體系的3.2版本,以通俗易懂的方式介紹Hadoop + Spark原生態組件的原理、集群搭建、實戰操作,以及整個Hadoop生態系統主流的大數據分析技術。 本書共分14...
11.3.1 Spark與Job Server整合原理 403 11.3.2 Spark與Job Server整合實戰 404 11.4 Spark與Redis整合原理與實戰 406 11.4.1 Spark與Redis整合原理 406 11.4.2 Spark與Redis整合實戰 407 中篇 商業案例 第12章 Spark商業案例之大數據電影點評系統套用案例 412 12.1 通過RDD實現分析電影的用戶行為信息 412 ...
對於有條件的公司和學校,參照書中介紹的搭建過程,同樣可以將實踐平台搭建在多台實體計算機上,以便更加接近於大數據和機器學習真實的運行環境。《Hadoop + Spark 大數據巨量分析與機器學習整合開發實戰》非常適合於學習大數據基礎知識的初學者閱讀,*適合正在學習大數據理論和技術的人員作為上機實踐用的教材。圖書目錄 第1...
《Hadoop + Spark 大數據巨量分析與機器學習整合開發實戰》是2017年清華大學出版社出版的圖書,作者是林大貴。前言 大數據的影響力正深入到各個領域和行業中。特別在商業、經濟以及其他領域,將大量數據進行分析後,便可得到許多數據的關聯性。這些關聯性可用於預測商業趨勢、行銷研究、金融財務、疾病研究、打擊犯...
《Spark大數據分析:源碼解析與實例詳解》是2019年電子工業出版社出版的書籍,作者是劉景澤。該書共有90個實例,1個完整項目。內容提要 《Spark大數據分析:源碼解析與實例詳解》基於Spark 2.3.x、Spark 2.4.x系列版本,採用“理論+實踐”的形式編寫。結構清晰、實例豐富、通俗易懂、實用性強,特別適合Spark的初學...
《Spark大數據分析——源碼解析與實例詳解》是2019年7月電子工業出版社出版的圖書,作者是劉景澤。 內容簡介 講解了網路大數據時代應運而生的、能高效迅捷地分析處理數據的工具——Spark,它帶領讀者快速掌握用 Spark 收集、計算、簡化和保存海量數據的方法,學會互動、疊代和增量式分析,解決分區、數據本地化和自...
《Spark大數據商業實戰三部曲》是2020年清華大學出版社出版的圖書,作者是王家林。內容簡介 《Spark大數據商業實戰三部曲:核心解密 商業案例 性能調優(第2版)》基於 Spark 2.4.X版本,以 Spark商業案例實戰和 Spark在生產環境下幾乎所有類型的性能調優為核心,以 Spark核心解密為基石,對企業生產環境下的 Spark商業...
通過對應的實例全面、詳細地介紹了整個Spark實戰開發的流程。*後,還介紹了Spark的高級套用,包括Spark流應用程式及可擴展和快速的機器學習框架H2O。本書可以作為高等院校計算機、軟體工程、數據科學與大數據技術等專業的大數據課程材料,可用於指導Spark編程實踐,也可供相關技術人員參考使用。圖書目錄 目錄 譯者序 致謝 前...
5.6案例分析255 5.6.1探索數據256 5.6.2創建數據流260 5.6.3轉換操作267 5.6.4視窗操作268 5.7小結271 〖1〗Spark大數據處理與分析目錄〖3〗〖3〗第6章分散式的圖處理/272 6.1理解圖的概念272 6.2圖並行系統276 6.3一個例子279 6.4創建和探索圖283 6.4.1屬性圖284 6.4.2構建器287 6.4....
《Spark大數據分析》是2017年機械工業出版社出版的圖書,作者是穆罕默德·古勒。內容簡介 本書是關於大數據和Spark的一個簡明手冊。它將助你學習如何用Spark來完成很多大數據分析任務,其中覆蓋了高效利用Spark所需要知道的重要主題:如何使用SparkShell進行互動式數據分析、如何編寫Spark套用、如何在Spark中對大規模數據進行...
第二部分實現了一個企業背景調查系統,比較新穎的是,該系統借鑑了數據湖與Lambda架構的思想,涵蓋了批處理、流處理套用開發,並加入了一些開源組件來滿足需求,既是對本書第一部分很好的鞏固,又完整呈現了一個實時大數據套用的開發過程。第三部分是對全書的總結和展望。本書適合準備學習Spark的開發人員和數據分析師,...
3.4 大數據成就雲計算價值 62 3.5 數據向雲計算遷移 63 3.6 大數據清洗 64 3.7 雲計算時代的數據集成技術 66 3.8 雲推薦 67 3.9 本章小結 68 第4章 Spark大數據處理基礎 69 4.1 Spark大數據處理技術 69 4.1.1 Spark系統概述 69 4.1.2 Spark生態系統BDAS(伯利克分析棧) 70 4.1.3 Spark的...
《Hadoop & Spark大數據開發實戰》是2017年中國水利水電出版社出版的圖書,作者是肖睿、雷剛躍、宋麗萍、張宇、彭英。內容簡介 大數據讓我們以一種前所未有的方式,通過對海量數據進行分析,獲得有巨大價值的產品和服務,*終形成變革之力。本書圍繞Hadoop和Spark這兩個主流技術進行講解,主要內容包括Hadoop環境配置、...
《Spark大數據分析技術(Python版·微課版)》是2023年清華大學出版社出版的圖書,作者是曹潔。內容簡介 本書系統介紹Spark大數據處理框架。全書共8章,內容包括大數據技術概述、Spark大數據處理框架、Spark RDD編程、Spark SQL結構化數據處理、HBase分散式資料庫、Spark Streaming流計算、Spark MLlib機器學習、數據可視化。
本書通過理論和實踐相結合的方式對Spark的核心框架和生態圈做了詳細的解讀,不僅對Spark的原理進行詳細闡述,還結合Spark的源碼和案例操作展示了Spark框架的所具有的優雅和豐富的表現力。本書適合大數據從業者、Spark技術愛好者閱讀。相信通過學習本書,讀者能夠熟悉和掌握Spark這一當前流行的大數據計算框架,並將其投入到...
1.3 使用Spark,能做些什麼 9 1.3.1 使用Spark預測NC餐飲行業的餐館質量 10 1.3.2 Spark允許Lumeris進行快速數據傳輸 10 1.3.3 Spark分析CERN的設備日誌 ...7.8 用於大數據的檔案格式 144 7.8.1 傳統檔案格式的問題 144 7.8.2 Avro是基於模式的序列化格式 145 7.8.3 ORC是一種列式存儲格式 145 ...
第 1章PySpark大數據分析概述 1 1.1 大數據分析概述 1 1.1.1 大數據的概念 2 1.1.2 大數據分析的概念 3 1.1.3 大數據分析的流程 4 1.1.4 大數據分析的套用場景 6 1.1.5 大數據技術體系 6 1.2 Spark大數據技術框架 10 1.2.1 Spark 簡介 10 1.2.2 Spark 特點 11 1.2.3 ...
《Spark大數據分析技術(Scala版)》是2021年北京航空航天大學出版社出版的圖書。內容簡介 《Spark大數據分析技術(Scala版)》系統介紹了Spark大數據技術的相關知識,內容包括Spark概述、Scala基礎編程、基於Scala的Spark編程、Windows環境下的Spark綜合編程、SparkSQL結構化數據處理、SparkStreaming流計算、SparkGraphX圖計算、...
長期進行大數據處理、自然語言處理、深度學習、推薦算法的研究與實踐,有豐富的項目經驗。善於歸納和總結,所撰寫的部落格文章得到了大量讀者的好評。擅長數據分析與處理、算法實踐落地、用戶行為數據挖掘、大規模數據處理等技術。運營《網際網路技術猿》公眾號。圖書目錄 前言 第1篇 Spark基礎 第1章 初識Spark2 1.1 Spark...