Spark大數據分析與實戰(2019年清華大學出版社出版的圖書)

內容簡介

本書從初學者角度詳細介紹了Spark應用程式體系架構的核心技術，全書共9章。第1章詳細介紹開發Spark框架的Scala程式語言；第2～4、7～8章主要講解Spark核心基礎、SparkRDD彈性分散式數據集、Spark SQL處理結構化數據、Spark Streaming實時計算框架、Spark MLlib機器學習庫，並包含了搭建Spark集群、Spark集群的操作方式、利用Spark解決大數據工作中遇到的基本問題。第5～6章主要講解大數據環境中常見的輔助系統，HBase資料庫以及Kafka流處理平台，包含輔助系統的搭建方式、使用方法以及相關底層實現的基本原理；第9章是一個綜合項目，利用Spark框架開發流式計算系統。掌握Spark相關技術，能夠很好地適應企業開發的技術需要，為離線、實時數據處理平台的開發奠定基礎。

本書附有配套原始碼、教學PPT、題庫、教學視頻、教學補充案例、教學設計等資源。為了幫助初學者更好地學習本書中的內容，還提供了線上答疑，歡迎讀者關注。

本書可作為高等院校本、專科計算機相關專業，大數據課程的專用教材，是一本適合廣大計算機編程愛好者的優秀讀物。

圖書目錄

第1章Scala語言基礎1

1.1初識Scala1

1.1.1Scala概述1

1.1.2Scala的下載安裝2

1.1.3在IDEA開發工具中下載安裝

Scala外掛程式4

1.1.4開發第一個Scala程式6

1.2Scala的基礎語法9

1.2.1聲明值和變數9

1.2.2數據類型9

1.2.3算術和操作符重載10

1.2.4控制結構語句10

1.2.5方法和函式13

1.3Scala的數據結構15

1.3.1數組15

1.3.2元組18

1.3.3集合19

1.4Scala面向對象的特性24

1.4.1類與對象24

1.4.2繼承25

1.4.3單例對象和伴生對象26

1.4.4特質28

1.5Scala的模式匹配與樣例類29

1.5.1模式匹配30

1.5.2樣例類31

1.6本章小結31

1.7課後習題32

第2章Spark基礎33

2.1初識Spark33Spark大數據分析與實戰

2.1.1Spark概述33

2.1.2Spark的特點34

2.1.3Spark套用場景35

2.1.4Spark與Hadoop對比36

2.2搭建Spark開發環境37

2.2.1環境準備37

2.2.2Spark的部署方式37

2.2.3Spark集群安裝部署38

Spark大數據分析與實戰(2019年清華大學出版社出版的圖書)

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條