《Spark大數據處理:技術、套用與性能最佳化》是機械工業出版社出版的圖書,作者是高彥傑
基本介紹
- ISBN:9787111483861
- 作者:高彥傑
- 出版社:機械工業出版社
- 出版時間:2014年11月
- 頁數:268
- 定價:59.00
- 裝幀:平裝
- 叢書:大數據技術叢書
《Spark大數據處理:技術、套用與性能最佳化》是機械工業出版社出版的圖書,作者是高彥傑
《Spark大數據處理技術》是2015年1月電子工業出版社出版的圖書,作者是夏俊鸞、程浩、邵賽賽。內容簡介 本書以Spark 0.9版本為基礎進行編寫,是一本全面介紹Spark及Spark生態圈相關技術的書籍,是國內首本深入介紹 Spark 原理和架構的技術...
《spark大數據處理技術》是機械工業出版社2021年7月出版的書籍。內容簡介 本書通過兩個基本項目介紹了Scala語言的基本語法、函式式編程、高階函式、模式匹配等相關知識和技術;通過12個實訓項目,介紹了Spark的技術棧,內容涵蓋Spark Core、...
《Spark大數據技術與套用》是2018年人民郵電出版社出版的圖書。作者是肖芳 張良均。本書的大部分章節都包含了實訓與課後習題,通過練習和操作實踐,幫助讀者鞏固所學的內容。內容簡介 本書以任務為導向,較為全面地介紹了Spark大數據技術的...
《Spark套用技術與處理》是2020年天津大學出版社出版的圖書,作者是天津濱海迅騰科技集團有限公司。內容簡介 《Spark套用技術與處理》主要涉及八個項目,通過初識Spark與環境部署學習Spark的優勢和運行架構,通過手機號碼歸屬地信息查詢學習Scala...
本書共六章,涉及的主題主要包括大數據處理技術從Hadoop發展到Spark的必然性、快速體驗Spark的指引、Spark架構和原理、RDD運算元使用方法和示例、Spark算法設計實例、Spark程式最佳化方法。 本書適合需要使用Spark進行大數據處理的程式設計師、架構師和...
《Spark大數據分析技術(Python版·微課版)》是2023年清華大學出版社出版的圖書,作者是曹潔。內容簡介 本書系統介紹Spark大數據處理框架。全書共8章,內容包括大數據技術概述、Spark大數據處理框架、Spark RDD編程、Spark SQL結構化數據處理、...
《雲計算環境下Spark大數據處理技術與實踐》是2017年9月清華大學出版社出版的圖書,作者是鄧立國、佟強。內容簡介 本書圍繞網際網路重大的技術革命:雲計算、大數據進行闡述。雲計算環境下大數據處理構建是國民經濟發展的信息基礎設施,發展自主...
《Spark海量數據處理:技術詳解與平台實戰》是2019年12月人民郵電出版社出版的圖書,作者是范東來。內容簡介 本書基於Spark發行版2.4.4寫作而成,包含大量的實例與一個完整項目,層次分明,循序漸進。全書分為3部分,涵蓋了技術理論與實戰...
《Spark大數據處理與分析》是2020年清華大學出版社出版的圖書,作者是雷擎。內容簡介 本書是Spark技術入門的基礎類書籍,通過本書的學習實驗可以牢固掌握Spark編程技術的基本概念、原理和編程方法,能夠進行套用程式的實際開發。圖書目錄 第1...
7.6.4 網路數據處理案例(一) 164 7.6.5 網路數據處理案例(二) 171 7.6.6 stateful套用案例 175 7.6.7 window套用案例 180 7.7 性能考量 185 7.7.1 運行時間最佳化 185 7.7.2 記憶體使用與垃圾回收 186 第8章 Spark ...
第3篇 Spark技術 第12章 Spark概述 213 12.1 Spark框架原理 213 12.2 Spark大數據處理 214 12.3 RDD數據集 215 12.4 Spark子系統 215 第13章 Scala語言 216 13.1 Scala語法基礎 216 13.1.1 變數、常量與賦值 216 13.1....
第一部分(第1章):主要介紹了企業大數據系統的前期準備工作,包括如何構建企業大數據處理系統的軟體環境和集群環境。第二部分(第2~7章):依次重點講解了Spark的基本原理、使用方法和最佳化方式;Druid的基本原理、集群的搭建過程,以及相關...
個性化推薦系統、日誌分析系統、自然語言處理、數據挖掘等方面的案例; 高級篇(15~18)則講解了Spark的調度管理、存儲管理、監控管理、性能最佳化、最佳實踐以及重點算法的解讀; 擴展篇(19~20)講解了Sparkjob-server和Tachyon。
全面闡述了Spark Streaming流式處理平台,便於讀者能夠從入門開始了解搭建Spark平台,在此基礎上學習流式處理框架,並動手實踐,進行Spark Streaming流式大數據處理,包括與主流平台框架,如Kafka、Redis和ZooKeeper的對接套用等,並介紹了項目...
Spark是當前主流的大數據計算框架,本書較為全面地介紹了Spark的基本知識。按照“項目驅動、任務導向”的理念,全書設計了七個項目,分別是搭建Spark環境、編寫Scala程式處理4S店數據、Spark RDD分析交通違章記錄、Spark SQL處理結構化學生信息...
《大數據處理框架Apache Spark設計與實現(全彩)》以Apache Spark框架為核心,總結了大數據處理框架的基礎知識、核心理論、典型的Spark套用,以及相關的性能和可靠性問題。圖書目錄 第 1 章大數據處理框架概覽 ...2 1.1 大數據及其帶來的...
《大數據技術入門——Hadoop+Spark》是2022年清華大學出版社出版的圖書,作者是于海浩、劉志坤主編、韓詠、孫栩副主編。 內容簡介 本書基礎理論、套用開發以及實際案例相結合,圍繞Hadoop、Spark生態圈循序漸進地介紹關於大數據技術領域中的基...
本書首先講述大數據概念、特點、價值、重要性,接著介紹Hadoop、HBase、Hive 、Spark,然後詳細講解大數據技術在機器學習中的套用,包括大數據基礎理念和常見工具,大數據處理流程、方法和技術等 。本書主要作為高等院校計算機專業、信息管理...
7.5.2 編譯支持Hadoop 2.x的Spark 211 7.5.3 運行Hive On Spark測試用例213 第8章GraphX 215 8.1 GraphX簡介215 8.1.1 主要特點216 8.1.2 版本演化216 8.1.3 套用場景217 8.2 分散式圖計算處理技術介紹218 8.2.1 ...
本書主要內容包括大數據技術概述、Linux基礎與集群搭建、Hadoop集群配置、HDFS、MapReduce分散式編程、Hive大數據倉庫、HBase資料庫部署與操作、數據獲取與Flume套用、基於Spark的記憶體計算,以及利用大數據平台處理圖像及視頻。圖書目錄 第1章 ...
該書主要分為五大部分:大數據存儲技術實驗教程(分散式檔案系統和NoSQL資料庫),大數據處理框架實驗教程(MapReduce和Spark、實時處理框架Storm和Flink),大數據分析技術實驗教程(Druid、Drill、Kylin),大數據可視化實驗教程,大數據綜合套用...
1.2.4 大數據產業12 1.3 大數據技術基礎12 1.3.1 傳統的大數據處理流程12 1.3.2 大數據核心技術13 1.3.3 大數據技術分類14 1.3.4 大數據分析的方法理論16 1.4 大數據的社會價值17 1.5 大數據的商業套用18 1...
大數據技術與套用課程是信息管理等專業的必修課,且具有理論性和套用性特徵。該課程使學習者通過對基於Spark的關聯分析、HBase數據表基本操作、HDFS數據及檔案的增刪改查操作、Hive與MySQL配置、大數據可視化設計方法、Hadoop套用系統體系結構、...