《Spark快速數據處理》是2014年機械工業出版社出版的圖書,作者是[美]Holden Karau。
基本介紹
- 中文名:Spark快速數據處理
- 作者:[美]Holden Karau
- 出版社:機械工業出版社
- 出版時間:2014年4月
- 頁數:66 頁
- 定價:29 元
- 開本:16 開
- 裝幀:平裝
- ISBN:9787111463115
《Spark快速數據處理》是2014年機械工業出版社出版的圖書,作者是[美]Holden Karau。
Apache Spark是專為大規模數據處理而設計的快速通用的計算引擎。形成一個高速發展套用廣泛的生態系統。特點介紹 Spark 主要有三個特點:首先,高級 API 剝離了對集群本身的關注,Spark 套用開發者可以專注於套用所要做的計算本身。其次,...
5.2.2 Spark Structured Streaming的特點 200 5.2.3 Spark Structured Streaming的數據模型 201 5.2.4 創建一個Spark Structured Streaming套用 202 5.2.5 時間概念、延遲數據處理策略和容錯語義 206 5.2.6 Spark Structured ...
Holden Karau是Databricks的軟體開發工程師,活躍於開源社區。她還著有《Spark快速數據處理》。Andy Konwinski是Databricks聯合創始人,Apache Spark項目技術專家,還是Apache Mesos項目的聯合發起人。Patrick Wendell是Databricks聯合創始人,也是...
《Spark快速大數據分析第2版》是2021年人民郵電出版社出版的圖書,作者是[美] 朱爾斯·S.達米吉、[美] 布魯克·韋尼希、[印] 泰瑟加塔·達斯、[美] 丹尼·李。內容簡介 本書的主角是在大數據時代應運而生的數據處理與分析利器——...
3.6 使用Spark SQL進行數據探索 102 3.7 小結 107 第4章 Spark流處理:Spark Streaming 與Structured Streaming 108 4.1 一個Spark Streaming流處理的例子 109 4.2 訊息送達保證 110 4.3 Google MillWheel系統和Google ...
3.6 使用Spark SQL進行數據探索 3.7 小結 第4章 Spark流處理:Spark Streaming與Structured Streaming 4.1 一個Spark Streaming流處理的例子 4.2 訊息送達保證 4.3 Google MillWheel系統和Google Dataflow模型 4.4 Spark ...
第4 章 流處理引擎Apache Spark 51 兩種API 的由來 51 Spark 的記憶體使用 52 故障恢復 53 惰性執行 53 快取使用建議 53 延遲 54 面向吞吐的數據處理 55 Spark 的多語言API 55 快速實現數據分析 56 更多關於Spark 的內容 57 小結 ...
Apache Spark Spark Streaming是核心Spark API的一個擴展,它並不會像Storm那樣一次一個地處理數據流,而是在處理前按時間間隔預先將其切分為一段一段的批處理作業。Spark針對持續性數據流的抽象稱為DStream(DiscretizedStream),一個D...