《Spark核心機制解析及性能調優》是機械工業出版社出版的圖書,作者是王家林,段智華
基本介紹
- ISBN:9787111554424
- 作者:王家林、段智華
- 出版社:機械工業出版社
- 出版時間:2017年1月
- 定價:59
- 裝幀:平裝
- 叢書:大數據科學叢書
內容簡介
本書致力於Spark核心的深入解析,帶領讀者掌握Spark核心的各個關鍵知識點。具體內容由詳細講述RDD提供的功能以及內部實現的機制開始,通過源碼引導讀者深入理解Spark的集群部署的內部機制、Spark內部調度的機制、Executor的內部機制、Shuffle的內部機制,進而講述Tungsten的內部機制,接著又進一步深入分析了SparkStreaming的內部機制。本書的後部分,是任何Spark套用者都非常關注的Spark性能調優的內容。本書可以使讀者對Spark核心有更深入徹底的理解,從而實現對Spark系統深度調優、Spark生產環境下故障的定位和排除、Spark的二次開發和系統高級運維。本書的每章開篇均有重點介紹以引導讀者有目的有重點的閱讀或查閱。本書適合於對大數據開發有興趣的在校學生。同時,對有分散式計算框架套用經驗的人員,本書也可以作為...(展開全部) 本書致力於Spark核心的深入解析,帶領讀者掌握Spark核心的各個關鍵知識點。具體內容由詳細講述RDD提供的功能以及內部實現的機制開始,通過源碼引導讀者深入理解Spark的集群部署的內部機制、Spark內部調度的機制、Executor的內部機制、Shuffle的內部機制,進而講述Tungsten的內部機制,接著又進一步深入分析了SparkStreaming的內部機制。本書的後部分,是任何Spark套用者都非常關注的Spark性能調優的內容。本書可以使讀者對Spark核心有更深入徹底的理解,從而實現對Spark系統深度調優、Spark生產環境下故障的定位和排除、Spark的二次開發和系統高級運維。本書的每章開篇均有重點介紹以引導讀者有目的有重點的閱讀或查閱。本書適合於對大數據開發有興趣的在校學生。同時,對有分散式計算框架套用經驗的人員,本書也可以作為Spark源碼解析的參考書籍。 王家林 中國著名的Spark培訓專家,Apache Spark、Android 技術中國區布道師,DT大數據夢工廠創始人和首席專家,Android軟硬體整合專家。深入研究了Spark從 0.5.0 到 2.2.1 中共31個版本的Spark源碼,目前致力於開發最佳化的Spark中國版本。尤其擅長Spark在生產環境下各種類型和場景故障的排除和解決,痴迷於Spark在生產環境下任意類型(例如Shuffle和各種記憶體問題及數據傾斜問題等)的深度性能最佳化。 段智華 就職於中國電信股份有限公司上海分公司,系統架構師,CSDN部落格專家。專注於Spark大數據技術研發及推廣,跟隨Spark核心源碼技術的發展,深入研究Spark 2.1.1版本及Spark 2.2.1版本的源碼最佳化,對Spark大數據處理、機器學習等技術領域有豐富的實戰經驗和濃厚興趣。