《Spark實戰》是2019年機械工業出版社出版的圖書。
基本介紹
- 中文名:Spark實戰
- 作者:[克羅地亞]彼得·澤斯維奇
- 譯者:鄭美珠、田華、王佐兵
- 出版時間:2019年8月
- 出版社:機械工業出版社
- ISBN:9787111617488
- 裝幀:平裝
《Spark實戰》是2019年機械工業出版社出版的圖書。
《Spark實戰》是2019年機械工業出版社出版的圖書。內容簡介 本書介紹了Spark應用程式及更高級套用的工作流程,主要從使用角度進行了描述,每個具體內容都有對應的代碼。本書涵蓋了Apache Spark和它豐富的API,構成Spark的組件(包括Spark SQL...
《Spark大數據商業實戰三部曲》是清華大學出版社出版的圖書,作者是王家林、段智華、夏陽。內容簡介 本書基於Spark2.2.X,以Spark商業案例實戰和Spark在生產環境下幾乎所有類型的性能調優為核心,以Spark核心解密為基石,分為上篇、中篇、...
《Spark性能最佳化實戰》是2023年清華大學出版社出版的圖書,作者是謝雪葵。內容簡介 《Spark性能最佳化實戰:突破性能瓶頸,遨遊數據重洋》全面、系統、深入地介紹Apache Spark性能最佳化的相關技術和策略,涵蓋從Spark性能最佳化的基礎知識到核心技術...
《spark項目實戰》是2021年清華大學出版社出版的圖書。本書運用Spark計算框架的核心組件對電商數據進行分析,以項目形式呈現,其內容涵蓋環境搭建、數據分析、數據持久化和數據可視化, 涉及JavaEE、ECharts、Hadoop、HBase、Spark、Kafka和...
《Spark機器學習實戰》是2020年9月人民郵電出版社出版的圖書,作者是[美]西亞瑪克·阿米爾霍吉(Siamak Amirghodsi)。內容簡介 機器學習是一門多領域交叉學科,可以通過模擬來讓計算機獲取新的知識或技能。Apache Spark是一種通用大數據框架...
《Spark入門與大數據分析實戰》是清華大學出版社出版的一本書,作者是遲殿委。內容簡介 本書基於Spark 3.3.1框架展開,系統介紹Spark生態系統各組件的操作,以及相應的大數據分析方法。《Spark入門與大數據分析實戰》各章節均提供豐富的示例...
《Spark核心源碼分析與開發實戰》作者是王家林,王雁軍,王家虎,是2016機械工業出版社出版的圖書,本書主要講述了Spark技術在國內外的套用越來越廣泛,它正在逐漸走向成熟,並在這個領域扮演更加重要的角色。國外一些大型網際網路公司已經部署了...
Spark零基礎實戰詳細解密了Spark的高可用性、核心架構、運行機制等內容。內容簡介 Spark是業界公認的近幾年發展最快、最受關注度的一體化多元化的大數據計算技術,可以同時滿足不同業務場景和不同數據規模的大數據計算的需要。本書首先通過...
《Spark大數據分析實戰》是清華大學出版社出版的一本圖書,作者是張偉洋。內容介紹 本書作為Spark的入門書,從Spark核心程式語言Scala講起,涵蓋當前Spark主流的開發組件。以實操為主,深入講解每一個操作步驟,包括Spark RDD離線數據處理、...
在Spark、Hadoop、Android、Docker等方面有豐富的源碼、實務和性能最佳化經驗。徹底研究了Spark從0.5.0到1.1.0共18個版本的Spark源碼,電子書《Spark+GraphX大規模圖計算和圖挖掘》、《Spark實戰高手之路》的作者。從2014年6月24日開始...
《Spark 3.x大數據分析實戰(視頻教學版)》是2022年清華大學出版社出版的圖書,作者是張偉洋。內容簡介 本書基於Spark 3.2.x版本,從Spark核心程式語言Scala講起,涵蓋了當前整個Spark生態系統主流的大數據開發技術。全書共9章,第1章...
第2章Spark基礎33 2.1初識Spark33Spark大數據分析與實戰 2.1.1Spark概述33 2.1.2Spark的特點34 2.1.3Spark套用場景35 2.1.4Spark與Hadoop對比36 2.2搭建Spark開發環境37 2.2.1環境準備37 2.2.2Spark的部署方式37 2.2.3...
《Spark大數據分析與實戰》是2020年09月西安電子科技大學出版社出版的圖書,作者鄭述招,本書共七個項目,較為全面地介紹了Spark的數據分析與編程基本知識。內容簡介 Spark是當前主流的大數據計算框架,本書較為全面地介紹了Spark的基本...
《Spark大數據實時分析實戰》是2020年北京理工大學出版社出版的圖書。內容簡介 《Spark大數據實時分析實戰》分為六個項目,通過真實大數據實時分析項目的導入,引導讀者完成大數據實時分析平台Spark的搭建,通過對基於Hadoop生態圈中Yarn資源調度...
Spark作為下一代大數據處理引擎,經過短短几年的飛躍式發展,正在以燎原之勢席捲業界,現已成為大數據產業中的一股中堅力量。《Spark大數據分析技術與實戰》著重講解了Spark核心、Spark GraphX、Spark SQL、Spark Streaming和Spark MLlib的...
3.8 通過WordCount實戰解析Spark RDD內部機制 3.8.1 Spark WordCount動手實踐 3.8.2 解析RDD生成的內部機制 3.9 基於DataSet的代碼如何轉化為RDD 第4章 Spark Driver啟動內幕剖析 4.1 Spark Driver Program剖析 4.1.1 ...
1.3 Spark入門實戰 33 1.3.1 Spark獨立環境安裝實戰 33 1.3.2 YARN環境安裝實戰 36 1.3.3 Spark批處理作業入門實戰 39 1.3.4 Spark流式作業入門實戰 44 第 2章 Spark的作業調度和資源分配算法 49 2.1 Spark的作業調度 ...
《Spark 2.x 大數據分析與機器學習實戰》是旗標出版的圖書,作者是Romeo Kienzler 內容簡介 身處於信息爆炸的時代,數據無時無刻不間斷產生,大型購物網站的會員數據、工廠大規模的感測器數據…等等,當要處理的數據規模達到大數據等級時,...
第11章Spark實戰234 11.1Spark概述234 11.2Spark基本概念234 11.3Spark運算元實戰及功能描述238 11.3.1Value型Transformation運算元238 11.3.2Key-Value型Transformation運算元242 11.3.3Actions運算元245 11.4SparkStreaming實戰248 11.5Spark...
本書分為7章,第1章介紹大數據的基本概念、常用的大數據分析工具;第2章介紹Spark作為大數據處理的特點和算法;第3章介紹Spark實戰環境的搭建,涉及Windows和Linux作業系統;第4章介紹如何靈活套用PySpark對數據進行操作;第5章介紹PySpark ...
本書基於Spark發行版2.4.4寫作而成,包含大量的實例與一個完整項目,層次分明,循序漸進。全書分為3部分,涵蓋了技術理論與實戰,讀者可以從實戰中鞏固學習到的知識。第一部分主要圍繞BDAS(伯克利數據分析棧),不僅介紹了如何開發Spark...
12.1.2 Spark ML 230 12.2 典型機器學習流程介紹 230 12.2.1 提出問題 230 12.2.2 假設函式 231 12.2.3 代價函式 232 12.2.4 訓練模型確定參數 233 12.3 經典算法模型實戰 233 12.3.1 聚類算法實戰 233...
1.2 Spark生態系統 1.2.1 Spark Core 1.2.2 Spark Streaming 1.2.3 Spark SQL 1.2.4 BlinkDB 1.2.5 MLBase/MLlib 1.2.6 GraphX 1.2.7 SparkR 1.2.8 Alluxio 1.3 小結 第2章 搭建Spark實戰環境 2.1 基礎環境...
《Hadoop & Spark大數據開發實戰》是2017年中國水利水電出版社出版的圖書,作者是肖睿、雷剛躍、宋麗萍、張宇、彭英。內容簡介 大數據讓我們以一種前所未有的方式,通過對海量數據進行分析,獲得有巨大價值的產品和服務,*終形成變革之力...
《PySpark實戰指南》是2017年機械工業出版社出版的圖書,作者是托馬茲·卓巴斯、丹尼·李。內容介紹 Python是數據分析最常用的語言之一,而Apache Spark是一個開源的強大的分散式查詢和處理引擎。本書用詳盡的例子介紹了如何使用Python來調用...
Spark機器學習進階實戰 《Spark機器學習進階實戰》是2018年機械工業出版社出版的圖書。
《基於Hadoop與Spark的大數據開發實戰》是2018年人民郵電出版社出版的圖書。編輯推薦 1、選取知識點核心實用,以網際網路 實現終身學習 2、以企業需求為設計導向,以任務驅動為講解方式 3、以案例為主線組織知識點,以實戰項目來提升技術 4...
7.5.4 Spark Streaming記憶體最佳化132 7.6 實例——項目實戰中的調優示例133 7.6.1 合理的批處理時間(batchDuration)133 7.6.2 合理的Kafka拉取量(maxRatePerPartition參數設定)134 7.6.3 快取反覆使用的Dstream(RDD)135 7....
《Hadoop + Spark 大數據巨量分析與機器學習整合開發實戰》是2017年清華大學出版社出版的圖書,作者是林大貴。前言 大數據的影響力正深入到各個領域和行業中。特別在商業、經濟以及其他領域,將大量數據進行分析後,便可得到許多數據的關聯性...