《基於Hadoop的大數據分析和處理》是2017年電子工業出版社出版的圖書,作者是魏祖寬、劉兆宏。
基本介紹
- 書名:基於Hadoop的大數據分析和處理
- 作者:魏祖寬,劉兆宏
- 出版社:電子工業出版社
- 出版時間:2017年6月
- 頁數:268 頁
- 開本:16 開
- ISBN:9787121317392
- 千 字 數:510
- 版 次:01-01
《基於Hadoop的大數據分析和處理》是2017年電子工業出版社出版的圖書,作者是魏祖寬、劉兆宏。
PHAT-Data™(Peta-Scale Hadoop分析技術)一站式Hadoop集群解決方案,由AMAX集團於2013年研發成功,兼容不同Hadoop distributions (Cloudera,Hortonworks , IDH 等),配置包含專有數據加速器。僅需3個節點,PHAT-Data可在12分鐘內處理完...
hive 並非為在線上事務處理而設計,hive 並不提供實時的查詢和基於行級的數據更新操作。hive 的最佳使用場合是大數據集的批處理作業,例如,網路日誌分析。設計特徵 hive 是一種底層封裝了Hadoop 的數據倉庫處理工具,使用類SQL 的hiveSQL ...
《Hadoop大數據處理》共10章,涉及的主題包括大數據處理概論、基於Hadoop的大數據處理框架、MapReduce計算模式、使用HDFS存儲大數據、HBase大資料庫、大數據的分析處理、Hadoop環境下的數據整合、Hadoop集群的管理與維護、基於MapReduce的數據挖掘...
《高等學校大數據技術與套用規劃教材:Hadoop大數據分析》是2019年7月1日中國鐵道出版社出版的圖書,作者是高永彬、錢亮宏、方誌軍。內容簡介 本書從Hadoop的原理和使用出發,在重點介紹Hadoop生態系統的重要組件HDFS、MapReduce、YARN、Hive和...
《Hadoop大數據分析技術》是清華大學出版社於2022年出版的書籍,作者是遲殿委、陳鵬程。內容簡介 伴隨Hadoop的成長,Hadoop不再是一個簡單的數據分散式存儲平台和工具,已經成長為一個完整的生態圈。本書採用Hadoop 3.2.2版本,系統講解...
《Hadoop大數據技術與套用》是2019年12月人民郵電出版社出版的圖書,作者是楊治明、許桂秋。內容簡介 本書採用理論與實踐相結合的方式,全面介紹了Hadoop大數據技術。主要內容包括初識Hadoop大數據技術、Hadoop環境配置,分散式檔案系統HDFS、資源...
《Hadoop大數據分析實戰》是2019年5月1日清華大學出版社出版的圖書,作者是[美] 斯里達爾?奧拉。內容簡介 本書詳細闡述了與Hadoop 3大數據分析相關的基本解決方案,主要包括Hadoop簡介、大數據分析概述、基於MapReduce的大數據處理、Python-...
《Hadoop權威指南:大數據的存儲與分析(第4版)》是2017年7月清華大學出版社出版的圖書,作者是Tom White。內容簡介 本書結合理論和實踐,由淺入深,全方位介紹了Hadoop這一高性能的海量數據處理和分析平台。全書5部分24章,第Ⅰ部分...
YARN技術、MapReduce技術、Hadoop I/O操作、海量資料庫技術HBase、ZooKeeper技術、分散式數據倉庫技術Hive、分散式數據分析工具Pig,以及數據遷移工具Sqoop,最後對大數據實時處理技術做了簡單介紹,旨在讓讀者了解當前其他的大數據處理技術。
本書通俗易懂、結構清晰,著重於分析解決問題的思路和具體實施過程。本書適合作為高等院校計算機相關專業的程式設計教材,也可作為Hadoop技術的培訓圖書。圖書目錄 第1章 初識Hadoop及HDFS分散式系統1 1.1 初識Hadoop1 1.1.1大數據概述...
例如從算法內部的直方圖表述方式、從直方圖的存儲檔案的壓縮等方面;大數據需要不斷的追加新數據,因此提出了數據立方的更新策略,即主立方和子立方共存,適當時機進行重新計算,而非增量更新;(3)基於Hadoop的HistCube上多種聚集查詢算法...
《實戰Hadoop大數據處理》是2015年8月清華大學出版社出版的圖書,作者是曾剛。內容簡介 本書以“大數據”為起點,較詳細地介紹了Hadoop的相關知識。全書共分為9章,介紹了大數據的基本理論、Hadoop生態系統、Hadoop的安裝、HDFS分散式檔案系統...
本書圍繞Hadoop生態圈相關係統介紹大數據處理架構。全書共11章,其中,第1、2章主要帶領大家認識Hadoop以及學會搭建Hadoop集群;第3~5章講解分散式檔案系統(HDFS)、分散式計算框架MapReduce以及分散式協調服務;第6章講解Hadoop 2.0新特性...
全書共11章,分別講解大數據概念、Hadoop基礎知識、Hadoop集群部署、HDFS、MapReduce、YARN、ZooKeeper、Hive、Flume、Azkaban和Sqoop,並在最後開發一個完整的網站流量日誌分析系統,幫助讀者鞏固前面所學的內容。 本書附有配套視頻、教學課件...
第1章 Hadoop概述 1 1.1 商業分析與大數據 2 1.1.1 Hadoop的組件 3 1.1.2 Hadoop分散式檔案系統(HDFS) 3 1.1.3 MapReduce是什麼 4 1.1.4 YARN是什麼 5 1.2 ZooKeeper是什麼 6 1.3 Hive是什麼 7 1.4 與其他系統...
Hadoop大數據處理實戰 《Hadoop大數據處理實戰》是2020年上海交通大學出版社出版的圖書。
對於有條件的公司和學校,參照書中介紹的搭建過程,同樣可以將實踐平台搭建在多台實體計算機上,以便更加接近於大數據和機器學習真實的運行環境。《Hadoop+Spark大數據巨量分析與機器學習整合開發實戰》非常適合於學習大數據基礎知識的初學者閱讀...
第三篇 大數據處理與項目開發 243 第10章 互動式數據處理 245 10.1 數據預處理 245 10.1.1 查看數據 245 10.1.2 數據擴展 247 10.1.3 數據過濾 247 10.1.4 數據上傳 248 10.2 創建數據倉庫 24...
《大數據Hadoop 3.X分散式處理實戰》是2020年4月人民郵電出版社出版的圖書,作者是吳章勇、楊強。內容簡介 本書以實戰開發為原則,以Hadoop 3.X生態系統內的主要大數據工具整合套用及項目開發為主線,通過Hadoop大數據開發中常見的11個典型...
全書分為“基礎實驗篇”和“拓展實驗篇”兩篇,共10章,涉及數據採集、數據存儲與管理、數據處理與分析等大數據套用生命周期中各階段典型組件的部署、使用和基礎編程方法。“基礎實驗篇”內容包括部署全分布模式Hadoop集群、實戰HDFS、Map...
Hadoop大數據處理技術基礎與實踐 《Hadoop大數據處理技術基礎與實踐》是2015年人民郵電出版社出版的圖書。