《Spark實時大數據分析——基於Spark Streaming框架》是2018年清華大學出版社出版的圖書,作者是(美)祖貝爾·納比。
基本介紹
- 書名: Spark實時大數據分析——基於Spark Streaming框架
- 作者:(美)祖貝爾·納比
- 出版社: 清華大學出版社
- 出版時間:2018年
- 定價:89 元
- ISBN: 9787302511878
《Spark實時大數據分析——基於Spark Streaming框架》是2018年清華大學出版社出版的圖書,作者是(美)祖貝爾·納比。
《Spark大數據分析——源碼解析與實例詳解》是2019年7月電子工業出版社出版的圖書,作者是劉景澤。 內容簡介 講解了網路大數據時代應運而生的、能高效迅捷地分析處理數據的工具——Spark,它帶領讀者快速掌握用 Spark 收集、計算、簡化...
《實時大數據分析——基於Storm、Spark技術的實時套用》是2018年1月清華大學出版社出版的圖書,作者是[美]Sumit Gupta、Shilpi Saxena。內容簡介 本書詳細闡述了實時大數據分析的實現過程,主要包括大數據技術前景及分析平台;熟悉Storm平台;...
《Spark Streaming實時流式大數據處理實戰》是2019年4月機械工業出版社出版的圖書,作者是肖力濤 。內容簡介 本書以翔實的原理講解和充實的實戰代碼剖析,全面闡述了Spark Streaming流式處理平台,便於讀者能夠從入門開始了解搭建Spark平台,在...
通過真實大數據實時分析項目的導入,引導讀者完成大數據實時分析平台Spark的搭建,通過對基於Hadoop生態圈中Yarn資源調度框架,搭建Spark日誌管理系統,搭建Kafka分散式訊息系統,在工作中實現使用SparkStreaming實時讀取Kafka中的數據進行實時處理。
《Spark大數據分析技術(Python版·微課版)》是2023年清華大學出版社出版的圖書,作者是曹潔。內容簡介 本書系統介紹Spark大數據處理框架。全書共8章,內容包括大數據技術概述、Spark大數據處理框架、Spark RDD編程、Spark SQL結構化數據處理、...
1.1 Spark是什麼 1 1.2 一個大一統的軟體棧 2 1.2.1 Spark Core 2 1.2.2 Spark SQL 3 1.2.3 Spark Streaming 3 1.2.4 MLlib 3 1.2.5 GraphX 3 1.2.6 集群管理器 4 1.3 Spark的用戶和用途 ...
《Spark大數據分析技術與實戰》著重講解了Spark核心、Spark GraphX、Spark SQL、Spark Streaming和Spark MLlib的核心概念與理論框架,並提供了相應的示例與解析。《Spark大數據分析技術與實戰》共分為8章,其中前4章介紹Spark核心,主要包括...
5.6案例分析255 5.6.1探索數據256 5.6.2創建數據流260 5.6.3轉換操作267 5.6.4視窗操作268 5.7小結271 〖1〗Spark大數據處理與分析目錄〖3〗〖3〗第6章分散式的圖處理/272 6.1理解圖的概念272 6.2圖並行系統276 6.3...
第2~4、7~8章主要講解Spark核心基礎、SparkRDD彈性分散式數據集、Spark SQL處理結構化數據、Spark Streaming實時計算框架、Spark MLlib機器學習庫,並包含了搭建Spark集群、Spark集群的操作方式、利用Spark解決大數據工作中遇到的基本問題。
4.3 Spark配置 92 4.3.1 環境變數 92 4.3.2 系統屬性 93 4.3.3 配置日誌 95 4.3.4 Spark 硬體配置 95 4.4 Spark模式部署概述 96 4.5 Spark Streaming實時計算框架 98 4.6 Spark SQL 查詢、DataFrames分散式數據集和...
本書共分11章,內容包括Scala編程基礎、Spark框架全生態體驗、Spark RDD、Spark SQL、Kafka、Spark Streaming、Spark ML、Spark GraphX、Redis等技術框架和套用,並通過廣告點擊實時大數據分析和電影影評大數據分析兩個綜合項目進行實戰提升。...
《Spark快速大數據分析第2版》是2021年人民郵電出版社出版的圖書,作者是[美] 朱爾斯·S.達米吉、[美] 布魯克·韋尼希、[印] 泰瑟加塔·達斯、[美] 丹尼·李。內容簡介 本書的主角是在大數據時代應運而生的數據處理與分析利器——...
《Spark大數據分析與實戰》是2020年09月西安電子科技大學出版社出版的圖書,作者鄭述招,本書共七個項目,較為全面地介紹了Spark的數據分析與編程基本知識。內容簡介 Spark是當前主流的大數據計算框架,本書較為全面地介紹了Spark的基本...
Spark 與大數據開源技術 11 9.4 Java API 241 9.5 小結 241 第10 章 Spark Streaming 242 流數據處理框架 242 10.1 快速入門 243 10.2 SparkStreaming 基本概念 245 10.2.1 連結和初始化 245 10.2.2 時間和視窗概念 246 ...
1.2 Spark大數據處理框架 20 1.2.1 Spark速度為何如此之快 20 1.2.2 RDD:分散式函式式編程 24 1.3 Spark子框架解析 28 1.3.1 圖計算框架Spark GraphX 28 1.3.2 實時流處理框架(Spark Streaming) 41 1.3.3 互動式...
本書以任務為導向,較為全面地介紹了Spark大數據技術的相關知識。全書共9章,具體內容包括Spark概述;Scala基礎;Spark編程;Spark編程進階;Spark SQL:結構化數據檔案處理;Spark Streaming:實時計算框架;Spark GraphX:圖計算框架;Spark ...
《Scala和Spark大數據分析函式式編程、數據流和機器學習》是2020年6月1日清華大學出版社出版的圖書,作者是雷扎爾·卡里姆(Md.、Rezaul、Karim)、斯里達爾·阿拉(SridharAl la)。作者介紹 Md. Rezaul Karim 是德國Fraunhofer FIT的研究...
《大數據處理框架Apache Spark設計與實現(全彩)》由電子工業出版社於2020年8月出版,作者是許利傑,方亞芬。本書採用問題驅動的敘述方式,強調基本原理的闡述,內容紮實,深入Spark底層。內容簡介 《大數據處理框架Apache Spark設計與實現(...
通過編寫Spark作業將流式網頁日誌存入Cassandra113 總結120 第6章?與Spark高級庫集成121 實時查詢流數據122 了解Spark SQL122 集成Spark SQL與流數據129 圖的分析——Spark GraphX135 GraphX API介紹137 集成Spark Streaming...
第二部分Spark大數據處理框架的核心理論(第3~4章):介紹Spark框架將應用程式轉化為邏輯處理流程,進而轉化為可並行執行的物理執行計畫的一般過程及方法。第三部分典型的Spark套用(第5章):介紹疊代型的Spark機器學習套用和圖計算套用。...
本書以大數據處理引擎Spark的穩定版本1.6.x為基礎,從套用案例、原理、源碼、流程、調優等多個角度剖析Spark上的實時計算框架SparkStreaming。在勾勒出SparkStreaming架構輪廓的基礎上,從基本源碼開始進行剖析,由淺入深地引導已具有Spark和...
11.4.1 實例1:實時測試客戶端傳輸的數據 207 11.4.2 實例2:監控本地資料夾並寫入到HDFS中 208 11.5 習題與思考 210 第3篇 Spark技術 第12章 Spark概述 213 12.1 Spark框架原理 213 12.2 Spark大數據處理 214 12.3 RDD...