《Spark編程基礎》是2018年11月人民郵電出版社出版的圖書,作者是林子雨、賴永炫、陶繼平。
基本介紹
- 中文名:Spark編程基礎
- 作者:林子雨、賴永炫、陶繼平
- ISBN:9787115475985
- 定價:49.8元
- 出版社:人民郵電出版社
- 出版時間:2018年11月
- 裝幀:平裝
- 開本:16開
《Spark編程基礎》是2018年11月人民郵電出版社出版的圖書,作者是林子雨、賴永炫、陶繼平。
《Spark大數據編程基礎(Scala版)》是2019年中南大學出版社出版的圖書,作者是高建良,盛羽。內容簡介 《普通高等院校數據科學與大數據技術專業“十三五”規劃教材:Spark大數據編程基礎(Scala版)》主要參照“數據科學與大數據技術”本科專業...
本書是一本講解Spark基礎套用及編程的實用教程,基於 Spark 2.3 版本,內容包括 Spark 與大數據、構建 Spark 運行環境、開發一個Spark 程式、深入理解 Spark 程式代碼、RDD 編程、Spark SQL 結構化數據處理、Spark Streaming、Structured ...
《Spark從零開始》是慕課網提供的慕課課程,授課老師是Terby。課程簡介 Spark作為新一代大數據計算引擎,因為記憶體計算的特性,具有比hadoop更快的計算速度。本教程涉及Spark基礎概念RDD,KeyValueRDD,RDD的常用Transformation和Action操作等 課...
3.9從Spark源碼角度解析Scala函式式編程55 3.10小結57 第4章Scala模式匹配、類型系統徹底精通與Spark源碼閱讀58 4.1模式匹配語法58 4.2模式匹配實戰59 4.2.1模式匹配基礎實戰59 4.2.2數組、元祖實戰59 4.2.3Option實戰60 4.2...
本書共分11章,內容包括Scala編程基礎、Spark框架全生態體驗、Spark RDD、Spark SQL、Kafka、Spark Streaming、Spark ML、Spark GraphX、Redis等技術框架和套用,並通過廣告點擊實時大數據分析和電影影評大數據分析兩個綜合項目進行實戰提升。...
3.2 使用獨立集群的Spark套用 51 3.3 在YARN上運行Spark套用的部署模式 51 3.3.1 客戶端模式 52 3.3.2 集群模式 53 3.3.3 回顧本地模式 54 3.4 本章小結 55 第4章 Spark編程基礎 57 4.1 RDD簡介 57 4.2 ...
2.1 Spark的簡易安裝 6 2.2 準備編寫Spark應用程式的IDEA環境 10 2.3 將編寫好的Spark應用程式打包成jar提交到Spark上 18 第二部分 基礎篇 第3章 Spark上的RDD編程 23 3.1 RDD基礎 24 3.1.1 創建RDD 24 3.1.2 RDD轉化...
《Spark大數據處理與分析》是2020年清華大學出版社出版的圖書,作者是雷擎。內容簡介 本書是Spark技術入門的基礎類書籍,通過本書的學習實驗可以牢固掌握Spark編程技術的基本概念、原理和編程方法,能夠進行應用程式的實際開發。圖書目錄 第1...
第9章Spark SQL 9.1Spark SQL概述 9.1.1Spark SQL簡介 9.1.2Spark SQL的架構 9.2DataFrame 9.2.1DataFrame簡介 9.2.2DataFrame的創建 9.2.3DataFrame的常用操作 9.3Dataset 9.4Spark SQL編程 9.4.1DataFrame操作 9.4.2...
《Spark大數據分析實戰》是清華大學出版社出版的一本圖書,作者是張偉洋。內容介紹 本書作為Spark的入門書,從Spark核心編程語言Scala講起,涵蓋當前Spark主流的開發組件。以實操為主,深入講解每一個操作步驟,包括Spark RDD離線數據處理、...
第9章Spark的安裝和基礎編程/152 9.1基礎環境/152 9.2安裝Spark/152 9.2.1下載安裝檔案/152 9.2.2配置相關檔案/153 9.3使用 Spark Shell編寫代碼/154 9.3.1啟動Spark Shell/154 9.3.2讀取檔案/155 9.3.3編寫詞頻統計...
第2版新增了有關機器學習數學基礎以及Spark ML Pipeline API 的章節,內容更加系統、全面、與時俱進。圖書目錄 第 1章 Spark的環境搭建與運行 1 1.1 Spark的本地安裝與配置 2 1.2 Spark集群 3 1.3 Spark編程模型 4 1.3...
第一部分 基礎篇 第1章 序篇 1.1 Spark與BDAS 1.2 Databricks 1.3 如何通過GitHub向Spark貢獻代碼 1.4 如何選擇Spark編程語言 1.5 函式式編程思想 1.6 小結 第2章 Spark編程 2.1 Spark架構 2.2 Spark 2.x與...
4.3Dataset的基礎知識89 4.3.1Dataset簡介89 4.3.2Dataset對象的創建89 4.4RDD轉換為DataFrame90 4.4.1反射機制推斷Schema90 4.4.2編程方式定義Schema92 4.5Spark SQL運算元據源94 4.5.1操作MySQL94 4.5.2操作Hive數據集96...
《圖解Spark:核心技術與案例實戰》以Spark 2.0 版本為基礎進行編寫,全面介紹了Spark 核心及其生態圈組件技術。主要內容包括Spark 生態圈、實戰環境搭建、編程模型和內部重要模組的分析,重點介紹了訊息通信框架、作業調度、容錯執行、監控...
第 一部分(第1~4章)介紹了高性能分散式計算編程的基礎知識,包括分散式系統、Hadoop入門、Spark入門、Scalding入門等;第二部分(第5~8章)給出了使用Hadoop、Spark、Scalding的案例研究,涉及數據聚類、數據分類、回歸分析、推薦系統等。
15.2 RDD編程接口 229 15.3 RDD操作 229 15.3.1 Spark基於命令行的操作 229 15.3.2 Spark基於套用作業的操作 231 15.3.3 Spark操作的基礎命令與開發工具介紹 231 15.3.4 Spark基於YARN的調度模式 231 15.3.5 Spark基於...
本書以任務為導向,較為全面地介紹了Spark大數據技術的相關知識。全書共9章,具體內容包括Spark概述;Scala基礎;Spark編程;Spark編程進階;Spark SQL:結構化數據檔案處理;Spark Streaming:實時計算框架;Spark GraphX:圖計算框架;Spark ...
第一部分大數據處理框架的基礎知識(第1~2章):介紹大數據處理框架的基本概念、系統架構、編程模型、相關的研究工作,並以一個典型的Spark套用為例概述Spark套用的執行流程。第二部分Spark大數據處理框架的核心理論(第3~4章):介紹...
第 一部分 基礎篇 第 1章 序篇 2 1.1 Spark與BDAS 3 1.2 Databricks 4 1.3 如何通過GitHub向Spark貢獻代碼 5 1.4 如何選擇Spark編程語言 8 1.5 函式式編程思想 9 1.6 小結 12 第 2章 Spark編程 13 2....
通曉Spark、Hadoop、Android、HTML5,迷戀英語播音和健美。圖書目錄 第1章 Spark編程模型 1 1.1 Spark:一體化、多元化的高速 大數據通用計算平台和庫 1 1.1.1 為什麼需要使用Spark 5 1.1.2 Spark技術生態系統簡介 9 1.2 Spark...
並榮獲“2018年福建省教學成果二等獎”和“2018年廈門大學教學成果特等獎”,主持的課程《大數據技術原理與套用》獲評“2018年國家精品線上開放課程”和“2020年***線上一流本科課程”,主持的課程《Spark編程基礎》獲評“2020年福建省...
3.3MapReduce編程規範和示例 編寫 3.3.1編程規範 3.3.2MapReduce編程入門之 單詞計數 3.4MapTask數量及切片機制 3.4.1MapTask個數 3.4.2如何控制MapTask的個數 3.4.3Map並行度的經驗之談 3.5ReduceTask並行度的決定 3.6...
7.5.1 基礎數據源 154 7.5.2 高級數據源 155 7.6 Spark Streaming編程模式與案例分析 156 7.6.1 Spark Streaming編程模式 156 7.6.2 文本檔案數據處理案例(一) 157 7.6.3 文本檔案數據處理案例(二) 160 7.6.4 網路...
8.6本章小結/168第9章Spark的安裝和基礎編程/169 9.1基礎環境/169 9.2安裝Spark/169 9.2.1下載安裝檔案/169 9.2.2配置相關檔案/170 9.3使用 Spark Shell編寫代碼/171 9.3.1啟動Spark Shell/171 9.3.2讀取檔案/172 9....
《大數據實驗教程》以大數據開源平台Hadoop和Spark生態體系為基礎,介紹常見的大數據開源軟體的基礎知識、安裝部署和使用等內容,重點介紹Hadoop和Spark編程基礎知識。圖書目錄 第1章 大數據技術概述 1.1 大數據技術 1.2 大數據工具 第2章 ...
4.2 用PySpark建立第一個Spark RDD 161 4.2.1 PySpark Shell 建立RDD 163 4.2.2 VSCode編程建立RDD 165 4.2.3 Jupyter 編程建立RDD 167 4.3 RDD的操作與觀察 168 4.3.1 first操作 169 4.3.2 max操作 169 ...
元組、字典、集合和字元串等常用序列結構,函式基本用法,面向對象程式設計,解析算法、枚舉算法、遞推算法、遞歸算法、排序算法及查找算法的原理與Python實現,SQLite資料庫及Python操作SQLite資料庫的方法,大數據處理基礎及Spark編程基礎知識...