Spark 3.x大數據分析實戰（視頻教學版）

內容簡介

本書基於Spark 3.2.x版本，從Spark核心程式語言Scala講起，涵蓋了當前整個Spark生態系統主流的大數據開發技術。全書共9章，第1章講解了Scala語言的基礎知識，包括IDEA工具的使用等；第2章講解了Spark的主要組件、集群架構原理、集群環境搭建以及Spark應用程式的提交和運行；第3～9章講解了離線計算框架Spark RDD、Spark SQL和實時計算框架Kafka、Spark Streaming、Structured Streaming以及圖計算框架GraphX等的基礎知識、架構原理，同時包括常用Shell命令、API操作、核心源碼剖析，並通過多個實際案例講解各個框架的具體套用以及與Hadoop生態系統框架Hive、HBase、Kafka的整合操作。本書通俗易懂，案例豐富，注重實操，適合Spark新手和大數據開發人員閱讀，也可作為培訓機構和高校大數據及相關專業的教學用書。

圖書目錄

第1章 Spark開發準備——Scala基礎 1

1.1 什麼是Scala 1

1.2 安裝Scala 1

1.2.1 在Windows中安裝Scala 2

1.2.2 在CentOS 7中安裝Scala 3

1.3 Scala基礎 3

1.3.1 變數聲明 4

1.3.2 數據類型 5

1.3.3 表達式 6

1.3.4 循環 7

1.3.5 方法與函式 9

1.4 集合 12

1.4.1 數組 12

1.4.2 List 14

1.4.3 Map映射 15

1.4.4 元組 17

1.4.5 Set 18

1.5 類和對象 19

1.5.1 類的定義 19

1.5.2 單例對象 20

1.5.3 伴生對象 20

1.5.4 get和set方法 20

1.5.5 構造器 23

1.6 抽象類和特質 25

1.6.1 抽象類 25

1.6.2 特質 26

1.7 使用Eclipse創建Scala項目 28

1.7.1 安裝Scala for Eclipse IDE 28

1.7.2 創建Scala項目 29

1.8 使用IntelliJ IDEA創建Scala項目 29

1.8.1 在IDEA中安裝Scala外掛程式 30

1.8.2 創建Scala項目 31

1.9 動手練習 32

第2章初識Spark 33

2.1 大數據開發的總體架構 33

2.2 什麼是Spark 34

2.3 Spark的主要組件 35

Spark 3.x大數據分析實戰（視頻教學版）

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條