圖解Spark：核心技術與案例實戰

內容提要

《圖解Spark：核心技術與案例實戰》以Spark 2.0 版本為基礎進行編寫，全面介紹了Spark 核心及其生態圈組件技術。主要內容包括Spark 生態圈、實戰環境搭建、編程模型和內部重要模組的分析，重點介紹了訊息通信框架、作業調度、容錯執行、監控管理、存儲管理以及運行框架，同時還介紹了Spark 生態圈相關組件，包括Spark SQL 的即席查詢、Spark Streaming 的實時流處理套用、MLbase/MLlib 的機器學習、GraphX 的圖處理、SparkR 的數學計算和Alluxio 的分散式記憶體檔案系統等。

《圖解Spark：核心技術與案例實戰》從Spark 核心技術進行深入分析，重要章節會結合原始碼解讀其實現原理，圍繞著技術原理介紹了相關典型實例，讀者通過這些實例可以更加深入地理解Spark 的運行機制。另外《圖解Spark：核心技術與案例實戰》還套用了大量的圖表進行說明，讓讀者能夠更加直觀地理解Spark 相關原理。通過《圖解Spark：核心技術與案例實戰》，讀者將能夠很快地熟悉和掌握Spark 大數據分析計算的利器，在生產中解決實際問題。

圖解Spark：核心技術與案例實戰

基本介紹

內容提要

目錄

熱門詞條