《Hadoop與Spark入門》是2022年清華大學出版社出版的圖書,作者是覃雄派、陳躍國。
基本介紹
- 中文名:Hadoop與Spark入門
- 作者:覃雄派、陳躍國
- 出版社:清華大學出版社
- 出版時間:2022年11月1日
- 定價:59 元
- ISBN:9787302613633
《Hadoop與Spark入門》是2022年清華大學出版社出版的圖書,作者是覃雄派、陳躍國。
《大數據技術入門——Hadoop+Spark》是2022年清華大學出版社出版的圖書,作者是于海浩、劉志坤主編、韓詠、孫栩副主編。 內容簡介 本書基礎理論、套用開發以及實際案例相結合,圍繞Hadoop、Spark生態圈循序漸進地介紹關於大數據技術領域中的基...
《Hadoop+Spark大數據分析實戰》是清華大學出版社於2022年出版的書籍,作者是遲殿委。內容簡介 本書是Hadoop + Spark大數據分析技術入門書,基於Hadoop和Spark兩大框架體系的3.2版本,以通俗易懂的方式介紹Hadoop + Spark原生態組件的原理、...
《Hadoop+Spark大數據技術(微課版)》是2018年11月清華大學出版社出版的圖書,作者是劉彬斌主、李柏章、周磊、李永富。內容簡介 全書內容分為大數據系統基礎、Hadoop技術、Spark技術和項目實戰4部分。其中,Linux是學習大數據技術的基礎,先...
第2章 Apache Hadoop和Apache Spark入門13 2.1 Apache Hadoop概述13 2.1.1 Hadoop 分散式檔案系統 14 2.1.2 HDFS 的特性15 2.1.3 MapReduce 16 2.1.4 MapReduce 的特性 17 2.1.5 MapReduce v1與MapReduce v2對比...
《HadoopSpark大數據機器學習》是2021年科學出版社出版的圖書。內容簡介 人類已進入大數據時代。大數據是指具有海量(volume)、多模態(variety)、變化速度快(velocity)、蘊含價值高(value)和不精確性高(veracity)“5V”特徵的數據。大...
《大數據技術入門到商業實戰 Hadoop+Spark+Flink全解析》不僅適合大數據技術初學者閱讀,還可以幫助金融、電信、電商、能源、政府部門的大數據套用決策和技術人員,以及IT經理、CTO、CIO等快速學習大數據技術,並能作為大數據相關崗位培訓的教程...
《Hadoop + Spark生態系統操作與實戰指南》是2017年9月1日清華大學出版社出版的圖書,作者是餘輝。內容簡介 本書用於Hadoop+Spark快速上手,全面解析Hadoop和Spark生態系統,通過原理解說和實例操作每一個組件,讓讀者能夠輕鬆跨入大數據分析...
《大數據技術入門》是2016年清華大學出版社出版的圖書,作者是楊正洪。本書以Hadoop和Spark框架為線索,比較全面地介紹了Hadoop技術、Spark技術、大數據存儲、大數據訪問、大數據採集、大數據管理、大數據分析等內容。內容簡介 從2015年開始,國內...
因此編寫了這本大數據技術的入門書。 本書共12章,以Hadoop和Spark框架為線索,比較全面地介紹了Hadoop技術、Spark技術、大數據存儲、大數據訪問、大數據採集、大數據管理、大數據分析、大數據開發、大數據環境自動化部署(Docker和K8s)等內容。
2.8 Hadoop編程45 2.9 Hadoop流48 參考文獻51 第3章 Spark入門53 3.1 Spark簡介53 3.2 Spark內部結構54 3.3 Spark安裝58 3.3.1 安裝前的準備58 3.3.2 開始使用60 3.3.3 示例:Scala套用63 3.3.4 Python下...
1.5PythonSpark機器學習 9 1.6SparkMLPipeline機器學習流程介紹 10 1.7Spark2.0的介紹 12 1.8大數據定義 13 1.9Hadoop簡介 14 1.10HadoopHDFS分散式檔案系統 14 1.11HadoopMapReduce的介紹 17 1.12結論 18 第2章VirtualBox虛擬...
Spark零基礎實戰這本書定位於零基礎的學員,也可以作為有一定大數據Hadoop經驗的從業者以及對大數據非常感興趣的學生的第一本Spark入門書籍。書籍目錄 第1章Scala光速入門1 1.1Scala基礎與語法入門實戰1 1.1.1Scala基本數據類型1 1.1....
第3 章 Spark 環境搭建和使用方法 35 3.1 安裝Spark 36 3.1.1 基礎環境 36 3.1.2 下載安裝檔案 36 3.1.3 配置相關檔案 38 3.1.4 驗證Spark 是否安裝成功 39 3.1.5 Spark 和Hadoop 的互動 39 3.2 在...
最後,Spark 是一個通用引擎,可用它來完成各種各樣的運算,包括 SQL 查詢、文本處理、機器學習等,而在 Spark 出現之前,我們一般需要學習各種各樣的引擎來分別處理這些需求。性能特點 更快的速度 記憶體計算下,Spark 比 Hadoop 快100倍...
《Hadoop + Spark 大數據巨量分析與機器學習整合開發實戰》是2017年清華大學出版社出版的圖書,作者是林大貴。前言 大數據的影響力正深入到各個領域和行業中。特別在商業、經濟以及其他領域,將大量數據進行分析後,便可得到許多數據的關聯性...
本書圍繞Hadoop和Spark這兩個主流技術進行講解,主要內容包括Hadoop環境配置、分散式檔案系統HDFS、分散式計算框架MapReduce、資源調度框架YARN與Hadoop新特性、大數據數據倉庫Hive、離線處理輔助系統、Spark Core、 Spark SQL、Spark Streaming等...
著有圖書《Hive入門與大數據分析實戰》《Hadoop大數據分析技術》《Hadoop+Spark大數據分析實戰》《Spring Boot企業級開發實戰(視頻教學版)》《深入淺出Java編程》《Spring Boot+Spring Cloud微服務開發》。圖書目錄 第1章 Spark開發之Scala...
本書內容全面,實用性強,適合作為Hadoop大數據分析與挖掘的入門讀物,也可作為Java程式設計師的進階讀物。另外,本書還特別適合想要提高大數據項目開發水平的人員閱讀。對於專業的培訓機構和相關院校而言,本書也是一本不可多得的教學用書。圖書...
全書共9章,內容包括大數據技術概述、Scala語言基礎、Spark的設計與運行原理、Spark環境搭建和使用方法、RDD編程、Spark SQL、Spark Streaming、Structured Streaming和Spark MLlib。本書每章都安排了入門級的編程實踐操作,以便使讀者能更好地...
3.4 Spark的部署方式 91 3.5 本章小結 92 3.6 習題 93 第4章 Spark環境搭建和使用方法 94 4.1 安裝Spark 95 4.1.1 基礎環境 95 4.1.2 下載安裝檔案 95 4.1.3 配置相關檔案 96 4.1.4 Spark和Hadoop的...
1.2.3 Hadoop套用案例 8 任務3安裝Hadoop平台 9 1.3.1 安裝虛擬機 10 1.3.2 安裝Linux系統 13 1.3.3 安裝Hadoop偽分散式環境 30 本章總結 34 本章練習 34 第 2章Hadoop分散式檔案系統 35 任務1HDFS入門 36 2...
整個流程下來,讀者能夠建立起完整的關於 Hadoop 管理的體系架構。《Hadoop專家:管理、調優與SparkYARNHDFS安全》為 Hadoop 管理員而編寫,同時也適合Hadoop 開發人員使用。目錄 第Ⅰ部分 Hadoop架構與Hadoop集群介紹 第1章 Hadoop與Hadoop...
《Hadoop大數據挖掘從入門到進階實戰(視頻教學版)》一書由機械工業出版社出版發行。內容簡介 本書採用“理論+實戰”的形式編寫,全面介紹了Hadoop大數據挖掘的相關知識。本書秉承循序漸進、易於理解、學以致用和便於查詢的講授理念,講解時...
第1章 Hadoop大數據技術概述 1.1 Hadoop 的前世今生 1.2 Hadoop生態系統簡介 1.3 Hadoop優勢及套用領域 1.4 Hadoop與雲計算 1.5 Hadoop與Spark 1.6 Hadoop 與傳統關係型資料庫 第2章 Hadoop開發及運行環境搭建 2.1 Hadoop集群...
《Spark SQL入門與實踐指南》是2018年04月1日清華大學出版社出版的圖書,作者是紀涵、靖曉文、趙政達,主要講述了開發人員創建和運行Spark程式的方法技巧。內容簡介 Spark SQL是 Spark大數據框架的一部分,支持使用標準SQL查詢和HiveQL來...
《Hadoop大數據挖掘從入門到進階實戰(視頻教學版)》一書由鄧傑編寫,於2018年6月由機械工業出版社出版發行。內容簡介 本書採用“理論+實戰”的形式編寫,全面介紹了Hadoop大數據挖掘的相關知識。本書秉承循序漸進、易於理解、學以致用和...
第6章 使用Spark進行SQL與NoSQL編程 159 6.1 Spark SQL簡介 159 6.1.1 Hive簡介 160 6.1.2 Spark SQL架構 164 6.1.3 DataFrame入門 166 6.1.4 使用DataFrame 177 6.1.5 DataFrame快取、持久化與重新分區 185 6.1...
第6章 使用Spark進行SQL與NoSQL編程 134 6.1 Spark SQL簡介 134 6.1.1 Hive簡介 134 6.1.2 Spark SQL架構 138 6.1.3 DataFrame入門 141 6.1.4 使用DataFrame 150 6.1.5 DataFrame快取、持久化與重新分區 157 6.1...
本實踐教程主要介紹大數據軟體環境的搭建、大數據基礎編程和大數據實驗案例,可以幫助大數據學習者有效構建大數據實驗環境,快速開展入門級編程。內容包括Linux系統的安裝、Hadoop的安裝、HDFS基礎編程、HBase安裝和基礎編程、MapReduce基礎編程、...