《Hadoop高級數據分析使用Hadoop生態系統設計和構建大數據系統》是2018年清華大學出版社出版的圖書,作者是Kerry Koitzsch。
基本介紹
- 書名:Hadoop高級數據分析使用Hadoop生態系統設計和構建大數據系統
- 作者:Kerry Koitzsch
- 譯者: 王建峰、王瑛琦、於金峰
- 出版社: 清華大學出版社
- 出版時間:2018年01月01日
- 定價:59.80 元
- ISBN:9787302487302
- 印次:1-1
- 印刷日期:2017.11.23
《Hadoop高級數據分析使用Hadoop生態系統設計和構建大數據系統》是2018年清華大學出版社出版的圖書,作者是Kerry Koitzsch。
《Hadoop高級數據分析使用Hadoop生態系統設計和構建大數據系統》強調以下四點: ●具有分析組件及合理可視化結果的完整、靈活、可配置、高性能數據管道系統的重要性。深入探討的主題包括Spark、H2O、VopalWabbit(NLP)、...(展開全部) ...
《Hadoop高級編程:構建與實現大數據解決方案》是清華大學出版社於2014年7月1日出版的圖書,作者是[美] Boris Lublinsky,[美] Kevin T. Smith,[美] Alexey Yakubovich 。圖書目錄 第1章 大數據和Hadoop生態系統1 1.1 當...
Hadoop是一個由Apache基金會所開發的分散式系統基礎架構。用戶可以在不了解分散式底層細節的情況下,開發分散式程式。充分利用集群的威力進行高速運算和存儲。Hadoop實現了一個分散式檔案系統( Distributed File System),其中一個組件是HDFS(...
1.2 使用Hadoop構建大規模數據產品 4 1.2.1 利用大型數據集 4 1.2.2 數據產品中的Hadoop 5 1.3 數據科學流水線和Hadoop生態系統 6 1.4 小結 8 * 2 章 大數據作業系統 9 2.1 基本概念 10 2.2 Hadoop架構 11 2...
《Hadoop大數據平台構建與套用》是2020年3月電子工業出版社出版的圖書,作者是王傳東、盧澔、馬榮飛。內容簡介 本書基於Hadoop大數據平台,講解大數據平台的搭建與運維、大數據的採集與存儲、大數據的處理、數據的分析、數據的可視化等完整的...
《Hadoop大數據分析技術》是清華大學出版社於2022年出版的書籍,作者是遲殿委、陳鵬程。內容簡介 伴隨Hadoop的成長,Hadoop不再是一個簡單的數據分散式存儲平台和工具,已經成長為一個完整的生態圈。本書採用Hadoop 3.2.2版本,系統講解...
《Hadoop大數據平台構建與套用》是一本2018年高等教育出版社出版的圖書,作者是米洪,陳永 ,是以構建和開發“高職院校學生學情分析”系統為項目原型,以任務驅動為主線,指導學生基於Hadoop大數據平台,完成平台搭建與運維、大數據採集與...
《高等學校大數據技術與套用規劃教材:Hadoop大數據分析》是2019年7月1日中國鐵道出版社出版的圖書,作者是高永彬、錢亮宏、方誌軍。內容簡介 本書從Hadoop的原理和使用出發,在重點介紹Hadoop生態系統的重要組件HDFS、MapReduce、YARN、Hive和...
1.1.1 Hadoop的組件 3 1.1.2 Hadoop分散式檔案系統(HDFS) 3 1.1.3 MapReduce是什麼 4 1.1.4 YARN是什麼 5 1.2 ZooKeeper是什麼 6 1.3 Hive是什麼 7 1.4 與其他系統集成 8 1.4.1 Hadoop生態系統 9 1.4.2 數據...
第一部分介紹Hadoop基礎知識,內容包括:Hadoop的介紹和集群構建、Hadoop的分部式系統架構、MapReduce及其套用、Hadoop的版本特徵及進化。第二部分以雲計算為主題,詳細論述利用Hadoop的大數據分析和處理工具,以及NoSQL技術,內容包括:雲計算和...
本書共14章,分三個部分:基礎篇、實戰篇、高級篇。基礎篇介紹了數據挖掘、Hadoop大數據的基本原理,實戰篇介紹了一個個真實案例,通過對案例深入淺出的剖析,使讀者在不知不覺中通過案例實踐獲得大數據項目挖掘分析經驗,同時快速領悟看似...
本書用於Hadoop+Spark快速上手,全面解析Hadoop和Spark生態系統,通過原理解說和實例操作每一個組件,讓讀者能夠輕鬆跨入大數據分析與開發的大門。圖書目錄 第1章Hadoop概述1 1.1Hadoop簡介1 1.2Hadoop版本和生態系統3 1.3MapReduce簡介7...
第7~10章主要講解Hadoop生態圈的相關輔助系統,包括Hive、Flume、Azkaban和Sqoop;第11章是一個綜合項目——網站流量日誌數據分析系統,目的是教會大家如何利用Hadoop生態圈技術構建大數據系統架構並進行開發,同時加深對Hadoop技術的理解。
本書詳細闡述了與Hadoop 3大數據分析相關的基本解決方案,主要包括Hadoop簡介、大數據分析概述、基於MapReduce的大數據處理、Python-Hadoop科學計算和大數據分析、R-Hadoop統計數據計算、Apache Spark批處理分析、Apache Spark實時數據分析、Apache ...
2.1 Hadoop大數據套用生態系統 15 2.1.1 架構的基本理論 15 2.1.2 Hadoop大數據套用生態系統的主要組件及其關係 16 2.2 大數據採集技術 19 2.2.1 結構化數據採集工具 19 2.2.2 日誌收集工具與技術 20 2....
第1章 Hadoop大數據技術概述 1.1 Hadoop 的前世今生 1.2 Hadoop生態系統簡介 1.3 Hadoop優勢及套用領域 1.4 Hadoop與雲計算 1.5 Hadoop與Spark 1.6 Hadoop 與傳統關係型資料庫 第2章 Hadoop開發及運行環境搭建 2.1 Hadoop集群...
1.4.1 首席數據官 14 1.4.2 數據科學家(數據分析師) 15 1.4.3 大數據開發工程師 16 1.4.4 大數據運維工程師 17 1.5 本章小結 17 第2章 Hadoop大數據關鍵技術 19 2.1 Hadoop生態系統 19 2.1.1 架構的基本理論 19...
項目1 認識大數據 1 學習目標 1 項目描述 1 任務1.1 認知大數據,完成系統環境搭建 2 任務描述 2 任務目標 2 知識準備 2 任務實施 17 任務1.2 Hadoop環境搭建 23 任務描述 23 任務目標 23 知識準備 23 任務實施 ...
本書作為 Hadoop 大數據技術的項目化實戰教材,以任務驅動為導向,深入淺出地介紹了 Hadoop 及其周框線架的套用,涵蓋了當前 Hadoop 生態系統中的主流大數據技術。全書共 12 個項目,包括雲計算和大數據基礎概論、CentOS 的安裝與網路配置、...
本書以Hadoop 3.x及其周框線架為主線,介紹了整個Hadoop生態系統主流的大數據開發技術。全書共16章,第1章講解VMware中CentOS 7作業系統的安裝;第2章講解作業系統集群環境的配置;第3~16章講解Hadoop生態系統各框架HDFS、MapReduce、YARN...
使讀者熟悉Hadoop大數據開發兩大核心組件,即HDFS和MapReduce;第3~12章講解Hadoop生態系統各框架HDFS、MapReduce、輸入輸出、Hadoop集群配置、高可用集群、HBase、Hive、數據實時處理系統Flume,以及Spark框架數據處理、機器學習等實戰技術,並...
其中,Hadoop技術包括大數據與數據分析、Hadoop生態系統介紹、Hadoop存儲、Hadoop計算之MapReduce、Hadoop安全等;數據倉庫與Hive包括Hive與資料庫的基礎知識、Hive的高級特性、Hive最佳化及案例的套用;Flume分散式日誌處理系統包括Flume介紹、Flume...
全書共16章,第1章講解了VMware中CentOS 7作業系統的安裝;第2章講解了大數據開發之前對作業系統集群環境的配置;第3~16章講解了Hadoop生態系統各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和數據實時處理系統Flume、Kafka、...
本書適合作為高等院校計算機相關專業的程式設計教材,也可作為Hadoop技術的培訓圖書。圖書目錄 第1章 初識Hadoop及HDFS分散式系統1 1.1 初識Hadoop1 1.1.1大數據概述1 1.1.2大數據技術2 1.1.3Hadoop簡介3 1.2 分散式檔案系統...
本書作為《Hadoop大數據原理與套用》(本書作者編寫,西安電子科技大學出版社出版)的配套實驗教程,系統介紹了Hadoop生態系統中各個開源組件的相關知識和實踐技能。全書分為“基礎實驗篇”和“拓展實驗篇”兩篇,共10章,涉及數據採集、數據...