Spark實時大數據分析——基於Spark Streaming框架

Spark實時大數據分析——基於Spark Streaming框架

《Spark實時大數據分析——基於Spark Streaming框架》是2018年清華大學出版社出版的圖書,作者是(美)祖貝爾·納比。

基本介紹

  • 書名: Spark實時大數據分析——基於Spark Streaming框架
  • 作者:(美)祖貝爾·納比
  • 出版社: 清華大學出版社
  • 出版時間:2018年
  • 定價:89 元
  • ISBN: 9787302511878  
內容簡介,圖書目錄,

內容簡介

本書詳細闡述了與Spark實時大數據分析以及Spark Streaming框架相關的基本解決方案,主要包括大數據漫遊指南,實時RDD,高速流:連結外部數據源,邊界效應,實時ETL和分析技術,大規模機器學習,雲、Lambda及Python等內容。此外,本書還提供了豐富的示例以及代碼,以幫助讀者進一步理解相關方案的實現過程。
本書適合作為高等院校計算機及相關專業的教材和教學參考書,也可作為相關開發人員的自學教材和參考手冊。

圖書目錄

第1章 大數據漫遊指南 1
1.1 Spark前傳 1
1.1.1 Web 2.0時代 2
1.1.2 無處不在的感測器 7
1.2 Spark Streaming:MapReduce和CEP的交集 9
第2章 Spark簡介 10
2.1 安裝 11
2.2 執行 12
2.2.1 獨立集群模式(Standalone Cluster) 12
2.2.2 YARN模式 13
2.3 第一個應用程式 13
2.3.1 構建 16
2.3.2 執行 17
2.4 SparkContext 19
2.4.1 RDDs創建 19
2.4.2 處理依賴關係 20
2.4.3 創建共享變數 21
2.4.4 作業執行 22
2.5 RDD 22
2.5.1 持久化 23
2.5.2 轉換 24
2.5.3 行動(Action) 28
小結 29
第3章 實時RDD:DStream 30
3.1 從連續流到離散流 30
3.2 第一個Spark Streaming應用程式 31
3.2.1 構建和執行 34
3.2.2 Streaming Context 34
3.3 DStreams 36
3.3.1 Spark Streaming應用程式剖析 38
3.3.2 轉換 42
小結 52
第4章 高速流:並行化及其他 54
4.1 流數據的一大飛躍 54
4.2 並行化 56
4.2.1 Worker 56
4.2.2 執行器(Executor) 57
4.2.3 任務(Task) 59
4.3 批處...

相關詞條

熱門詞條

聯絡我們