Scala和Spark大數據分析函式式編程、數據流和機器學習

作者介紹

Md. Rezaul Karim 是德國Fraunhofer FIT的研究學者，也是德國亞琛工業大學的博士學位研究生預科生。他擁有計算機科學的學士與碩士學位。在加盟Fraunhofer FIT之前，他曾作為研究員任職於愛爾蘭的數據分析深入研究中心。更早之前，他還擔任過三星電子公司全球研究中心的首席工程師；該研究中心分布於韓國、印度、越南、土耳其以及孟加拉。再早之前，他還在韓國慶熙大學的資料庫實驗室擔任過助理研究員，在韓國的BMTech21公司擔任過研發工程師，在孟加拉國的i2軟體技術公司擔任過軟體工程師。

Karim擁有超過8年的研發領域工作經驗，並在如下算法和數據結構領域具有深厚的技術背景：C/C++、Java、Scala、R、Python、Docker、Mesos、Zeppelin、Hadoop以及MapReduce，並深入學習了如下技術：Spark、Kafka、DC/OS、DeepLearning4j以及H2O-Sparking Water。他的研究興趣包括機器學習、深度學習、語義網路、關聯數據(Linked Data)、大數據以及生物信息學。同時，他還是Packt出版社出版的以下兩本書籍的作者。

內容簡介

主要內容

◆ 理解Scala的面向對象和函式式編程概念

◆ 深入理解Scala的集合API

◆ 學習RDD和數據幀等Spark核心概念

◆ 使用Spark SQL和GraphX分析結構化與非結構化數據

◆ 使用Spark結構化流來開發具備可擴展性和容錯能力的流式套用

◆ 學習分類、回歸、降維和推薦系統等機器學習最佳實踐，以便使用Spark ML和Spark MLlib中的流行算法來建立預測模型

◆ 建立聚類模型，以便聚類大量數據

◆ 理解Spark套用的調優、調試和監控技術

◆ 使用獨立伺服器模式、Mesos和YARN模式在集群上部署Spark套用

圖書目錄

第1章 Scala簡介 1

1.1 Scala的歷史與設計目標 2

1.2 平台與編輯器 2

1.3 安裝與創建Scala 3

1.3.1 安裝Java 3

1.3.2 Windows 4

1.3.3 macOS 6

1.4 Scala：可擴展的程式語言 9

1.4.1 Scala是面向對象的 9

1.4.2 Scala是函式式的 9

1.4.3 Scala是靜態類型的 9

1.4.4 在JVM上運行Scala 10

Scala和Spark大數據分析函式式編程、數據流和機器學習

基本介紹

作者介紹

內容簡介

圖書目錄

相關詞條

熱門詞條