《Spark大數據分析實戰》是清華大學出版社出版的一本圖書,作者是張偉洋。
基本介紹
- 中文名:Spark大數據分析實戰
- 作者:張偉洋
- 出版社:清華大學出版社
- 出版時間:2020年8月1日
- 定價:79 元
- ISBN:9787302556954
《Spark大數據分析實戰》是清華大學出版社出版的一本圖書,作者是張偉洋。
《Spark大數據分析實戰》是清華大學出版社出版的一本圖書,作者是張偉洋。內容介紹 本書作為Spark的入門書,從Spark核心程式語言Scala講起,涵蓋當前Spark主流的開發組件。以實操為主,深入講解每一個操作步驟,包括Spark RDD離線數據處理、...
Spark作為下一代大數據處理引擎,經過短短几年的飛躍式發展,正在以燎原之勢席捲業界,現已成為大數據產業中的一股中堅力量。《Spark大數據分析技術與實戰》著重講解了Spark核心、Spark GraphX、Spark SQL、Spark Streaming和Spark MLlib的...
《Spark大數據分析與實戰》是2019年9月清華大學出版社出版的圖書,作者是黑馬程式設計師。內容簡介 本書從初學者角度詳細介紹了Spark應用程式體系架構的核心技術,全書共9章。第1章詳細介紹開發Spark框架的Scala程式語言;第2~4、7~8章主要...
《Spark入門與大數據分析實戰》是清華大學出版社出版的一本書,作者是遲殿委。內容簡介 本書基於Spark 3.3.1框架展開,系統介紹Spark生態系統各組件的操作,以及相應的大數據分析方法。《Spark入門與大數據分析實戰》各章節均提供豐富的示例...
《Spark大數據實時分析實戰》是2020年北京理工大學出版社出版的圖書。內容簡介 《Spark大數據實時分析實戰》分為六個項目,通過真實大數據實時分析項目的導入,引導讀者完成大數據實時分析平台Spark的搭建,通過對基於Hadoop生態圈中Yarn資源調度...
《圖解Spark 大數據快速分析實戰》是2022年人民郵電出版社出版的圖書。內容簡介 本書共8章,內容主要包括Spark概述及入門實戰,Spark的作業調度和資源分配算法,Spark SQL、DataFrame、Dataset的原理和實戰,深入理解Spark數據源,流式計算的...
《Spark 3.x大數據分析實戰(視頻教學版)》是2022年清華大學出版社出版的圖書,作者是張偉洋。內容簡介 本書基於Spark 3.2.x版本,從Spark核心程式語言Scala講起,涵蓋了當前整個Spark生態系統主流的大數據開發技術。全書共9章,第1章...
《Hadoop+Spark大數據分析實戰》是清華大學出版社於2022年出版的書籍,作者是遲殿委。內容簡介 本書是Hadoop + Spark大數據分析技術入門書,基於Hadoop和Spark兩大框架體系的3.2版本,以通俗易懂的方式介紹Hadoop + Spark原生態組件的原理、...
《Spark 2.x 大數據分析與機器學習實戰》是旗標出版的圖書,作者是Romeo Kienzler 內容簡介 身處於信息爆炸的時代,數據無時無刻不間斷產生,大型購物網站的會員數據、工廠大規模的感測器數據…等等,當要處理的數據規模達到大數據等級時,...
《大數據Spark企業級實戰》詳細解析了企業級Spark開發所需的幾乎所有技術內容,涵蓋Spark的架構設計、Spark的集群搭建、Spark核心的解析、Spark SQL、MLLib、GraphX、Spark Streaming、Tachyon、SparkR、Spark多語言編程、Spark常見問題及調優等...
11.4 Spark與Redis整合原理與實戰 406 11.4.1 Spark與Redis整合原理 406 11.4.2 Spark與Redis整合實戰 407 中篇 商業案例 第12章 Spark商業案例之大數據電影點評系統套用案例 412 12.1 通過RDD實現分析電影的用戶行為信息 412 12....
《Spark大數據分析:源碼解析與實例詳解》基於Spark 2.3.x、Spark 2.4.x系列版本,採用“理論+實踐”的形式編寫。全書共有90個實例,1個完整項目。內容提要 《Spark大數據分析:源碼解析與實例詳解》結構清晰、實例豐富、通俗易懂、實用...
《Hadoop + Spark 大數據巨量分析與機器學習整合開發實戰》是2017年清華大學出版社出版的圖書,作者是林大貴。前言 大數據的影響力正深入到各個領域和行業中。特別在商業、經濟以及其他領域,將大量數據進行分析後,便可得到許多數據的關聯性...
《Spark大數據分析——源碼解析與實例詳解》是2019年7月電子工業出版社出版的圖書,作者是劉景澤。 內容簡介 講解了網路大數據時代應運而生的、能高效迅捷地分析處理數據的工具——Spark,它帶領讀者快速掌握用 Spark 收集、計算、簡化...
1.3.1 使用Spark預測NC餐飲行業的餐館質量 10 1.3.2 Spark允許Lumeris進行快速數據傳輸 10 1.3.3 Spark分析CERN的...7.8 用於大數據的檔案格式 144 7.8.1 傳統檔案格式的問題 144 7.8.2 Avro是基於模式的序列化格式 145 ...
《Spark大數據商業實戰三部曲:核心解密 商業案例 性能調優(第2版)》基於 Spark 2.4.X版本,以 Spark商業案例實戰和 Spark在生產環境下幾乎所有類型的性能調優為核心,以 Spark核心解密為基石,對企業生產環境下的 Spark商業案例與性能...
通過對應的實例全面、詳細地介紹了整個Spark實戰開發的流程。*後,還介紹了Spark的高級套用,包括Spark流應用程式及可擴展和快速的機器學習框架H2O。本書可以作為高等院校計算機、軟體工程、數據科學與大數據技術等專業的大數據課程材料,可用於...
第 10章 大數據企業動態背景調查平台 305 10.1 企業背景調查 305 10.2 基於大數據的企業動態背景調查 308 10.2.1 企業行為信息 308 10.2.2 企業關聯方分析 311 10.3 數據採集與數據字典 313 10.4 企業背景調查平台...
大數據技術讓我們以一種前所未有的方式,對海量數據進行分析,從中獲得有巨大價值的產品和服務,*終形成變革之力。本書圍繞Hadoop和Spark兩個主流大數據技術進行講解,主要內容包括Hadoop環境配置、Hadoop分散式檔案系統(HDFS)、Hadoop分散式...
第1章主要介紹項目開發的基本情況;第2章主要介紹大數據集群環境的搭建;第3章主要介紹通過Spark實現熱門品類Top10分析,並對分析結果進行持久化操作;第4章主要介紹通過Spark實現各區域熱門商品Top3分析,並對分析結果進行持久化操作;第5...
《Hadoop & Spark大數據開發實戰》是2017年中國水利水電出版社出版的圖書,作者是肖睿、雷剛躍、宋麗萍、張宇、彭英。內容簡介 大數據讓我們以一種前所未有的方式,通過對海量數據進行分析,獲得有巨大價值的產品和服務,*終形成變革之力...
本書通過理論和實踐相結合的方式對Spark的核心框架和生態圈做了詳細的解讀,不僅對Spark的原理進行詳細闡述,還結合Spark的源碼和案例操作展示了Spark框架的所具有的優雅和豐富的表現力。本書適合大數據從業者、Spark技術愛好者閱讀。相信通過...
11.16在eclipse運行spark-submitYARN-client 273 11.17在eclipse運行spark-submitStandalone 277 11.18結論 280 第12章PythonSpark創建推薦引擎 281 12.1推薦算法介紹 282 12.2“推薦引擎”大數據分析使用場景 282 12.3ALS推薦算法的...