《Spark套用技術與處理》是2020年天津大學出版社出版的圖書,作者是天津濱海迅騰科技集團有限公司。
基本介紹
- 中文名:Spark套用技術與處理
- 作者:天津濱海迅騰科技集團有限公司
- 出版社:天津大學出版社
- 出版時間:2020年1月1日
- ISBN:9787561866238
《Spark套用技術與處理》是2020年天津大學出版社出版的圖書,作者是天津濱海迅騰科技集團有限公司。
《Spark大數據處理:技術、套用與性能最佳化》根據最新技術版本,系統、全面、詳細講解Spark的各項功能使用、原理機制、技術細節、套用方法、性能最佳化,以及BDAS生態系統的相關技術。 作為一個基於記憶體計算的大數據並行計算框架,Spark不僅很好...
《Spark大數據技術與套用》是2018年人民郵電出版社出版的圖書。作者是肖芳 張良均。本書的大部分章節都包含了實訓與課後習題,通過練習和操作實踐,幫助讀者鞏固所學的內容。內容簡介 本書以任務為導向,較為全面地介紹了Spark大數據技術的...
《雲計算環境下Spark大數據處理技術與實踐》是2017年9月清華大學出版社出版的圖書,作者是鄧立國、佟強。內容簡介 本書圍繞網際網路重大的技術革命:雲計算、大數據進行闡述。雲計算環境下大數據處理構建是國民經濟發展的信息基礎設施,發展自主...
《Spark大數據處理技術》是2015年1月電子工業出版社出版的圖書,作者是夏俊鸞、程浩、邵賽賽。內容簡介 本書以Spark 0.9版本為基礎進行編寫,是一本全面介紹Spark及Spark生態圈相關技術的書籍,是國內首本深入介紹 Spark 原理和架構的技術...
《Spark海量數據處理:技術詳解與平台實戰》是2019年12月人民郵電出版社出版的圖書,作者是范東來。內容簡介 本書基於Spark發行版2.4.4寫作而成,包含大量的實例與一個完整項目,層次分明,循序漸進。全書分為3部分,涵蓋了技術理論與實戰...
《spark大數據處理技術》是機械工業出版社2021年7月出版的書籍。內容簡介 本書通過兩個基本項目介紹了Scala語言的基本語法、函式式編程、高階函式、模式匹配等相關知識和技術;通過12個實訓項目,介紹了Spark的技術棧,內容涵蓋Spark Core、...
Spark大數據技術與套用 《Spark大數據技術與套用》是人民郵電出版社出版的圖書,作者是趙紅艷 許桂秋
Spark作為下一代大數據處理引擎,經過短短几年的飛躍式發展,正在以燎原之勢席捲業界,現已成為大數據產業中的一股中堅力量。《Spark大數據分析技術與實戰》著重講解了Spark核心、Spark GraphX、Spark SQL、Spark Streaming和Spark MLlib的...
1.3大數據技術新星——Spark 1.3.1Spark的出現與發展 1.3.2Spark協定族 1.3.3Spark的套用及優勢 第2章體驗Spark 2.1安裝和使用Spark 2.1.1安裝Spark 2.1.2了解Spark目錄結構 2.1.3使用Spark Shell 2.2編寫和...
《Spark大數據處理與分析》是2020年清華大學出版社出版的圖書,作者是雷擎。內容簡介 本書是Spark技術入門的基礎類書籍,通過本書的學習實驗可以牢固掌握Spark編程技術的基本概念、原理和編程方法,能夠進行套用程式的實際開發。圖書目錄 第1...
1.2.2Spark5 1.2.3Flink5 1.3大數據程式語言5 1.4線上資源5 1.5拓展閱讀——三次信息化浪潮的啟示6 1.6習題6 第2章Spark大數據處理框架7 2.1Spark概述7 2.1.1Spark的產生背景7 2.1.2Spark的優點8 2.1.3Spark的應...
2.2 Spark 系統架構 ...21 2.3 Spark 套用例子 ...24 2.3.1 用戶代碼基本邏輯 ... 24 2.3.2 邏輯處理流程 ... 28 2.3.3 物理執行計畫 ... 32 2.3.4 可視化執行過程 ... 34 2.4 Spark 編程模型 ......
通過集群管理器來運行Apache Spark 59 Spark 的集群管理器 61 分散式系統的彈性與容錯 62 故障恢復 63 集群管理器對容錯的支持 63 數據交付語義 64 微批處理與一次處理一個 66 微批處理:整體同步處理套用案例 66 一次處理一個 68 ...
《Spark大數據處理》是清華大學出版社出版的圖書,作者是劉軍,林文輝,方澄 內容簡介 劉軍, 男,1976年生人,博士,副教授,碩士生導師,北京郵電大學數據科學中心主任。2003年至2007年任職於IBM中國研究院,擔任高級研究員及部門經理,...
它將助你學習如何用Spark來完成很多大數據分析任務,其中覆蓋了高效利用Spark所需要知道的重要主題:如何使用SparkShell進行互動式數據分析、如何編寫Spark套用、如何在Spark中對大規模數據進行互動分析、如何使用SparkStreaming處理高速數據流、...
本書以Apache Spark框架為核心,總結了大數據處理框架的基礎知識、核心理論、典型的Spark套用,以及相關的性能和可靠性問題。本書分9章,主要包含四部分內容。第一部分大數據處理框架的基礎知識(第1~2章):介紹大數據處理框架的基本概念...
全面闡述了Spark Streaming流式處理平台,便於讀者能夠從入門開始了解搭建Spark平台,在此基礎上學習流式處理框架,並動手實踐,進行Spark Streaming流式大數據處理,包括與主流平台框架,如Kafka、Redis和ZooKeeper的對接套用等,並介紹了項目...
《企業大數據處理》是2017年機械工業出版社出版的圖書,作者是肖冠宇。內容簡介 這是一本立足於企業真實的商用項目來講解如何高效從事大數據實踐的著作。技術層面,從全棧的角度系統梳理和詳盡講解了大數據的核心技術,包括Spark、Druid、Flume...
·通過實例學習DataFrame、SQL、Dataset等Spark的核心API。·了解Spark的低級API實現,包括RDD以及SQL和DataFrame的執行過程。·了解Spark如何在集群上運行。·Spark集群和套用程式的調試、監控、和調優。·學習Spark強大的流處理引擎——結構化...
第15章 RDD技術 228 15.1 RDD的實現 228 15.1.1 數據源 228 15.1.2 調度器 228 15.2 RDD編程接口 229 15.3 RDD操作 229 15.3.1 Spark基於命令行的操作 229 15.3.2 Spark基於套用作業的操作 231 15.3.3 Spark操作...
第6章 Spark機器學習:MLlib 6.1 機器學習 6.2 Spark MLlib與Spark ML 6.3 數據預處理 6.4 分類算法套用 6.5 聚類算法套用 6.6 推薦系統套用 6.7 訓練之後 6.8 流式機器學習 6.9 小結 第7章 Spark深度學習:...
重點介紹了訊息通信框架、作業調度、容錯執行、監控管理、存儲管理以及運行框架,同時還介紹了Spark 生態圈相關組件,包括Spark SQL 的即席查詢、Spark Streaming 的實時流處理套用、MLbase/MLlib 的機器學習、GraphX 的圖處理、SparkR 的...
《大數據技術入門到商業實戰Hadoop+Spark+Flink全解析》是2021年機械工業出版社出版的圖書。本書全面詳細地介紹了大數據生態系統中的主流技術。全書共10章,主要包括大數據生態系統概述、大數據採集技術、大數據存儲技術、大數據分析處理技術等...
配置Spark以接收Flume事件73 封裝和部署Spark Streaming作業77 分散式日誌檔案處理的總體架構77 總結78 第4章?在流數據中套用Transformation79 理解並套用Transformation功能80 模擬日誌流80 功能操作82 轉換操作89 視窗操作91 ...
《大數據技術入門——Hadoop+Spark》是2022年清華大學出版社出版的圖書,作者是于海浩、劉志坤主編、韓詠、孫栩副主編。 內容簡介 本書基礎理論、套用開發以及實際案例相結合,圍繞Hadoop、Spark生態圈循序漸進地介紹關於大數據技術領域中的基...
《大數據處理技術套用與實踐》是2023年1月北京郵電大學出版社出版的圖書,作者:王曉光 劉 芳。出版信息 書 名:大數據處理技術套用與實踐 出版時間:2023-01-03 編 著 者:王曉光 劉芳 版 次:1-1 I S B N:978-7-56...
網路爬蟲、數據預處理、數據計算、數據分析、數據挖掘等多個技術領域和批流數據處理架構;主導新大陸教育大數據產品架構及數據系統設計;作為主編參與《大數據綜合實戰案例教程》、《Spark批處理技術與套用》、《大數據可視化套用技術》等教材;...