《Hadoop數據倉庫實戰》是2019年12月人民郵電出版社出版的圖書,作者是肖睿、蘭偉、廖春瓊。
基本介紹
- 中文名:Hadoop數據倉庫實戰
- 作者:肖睿、蘭偉、廖春瓊
- 出版社:人民郵電出版社
- 出版時間:2019年12月
- 頁數:242 頁
- 定價:52 元
- 開本:16 開
- 裝幀:平裝
- ISBN:9787115526090
《Hadoop數據倉庫實戰》是2019年12月人民郵電出版社出版的圖書,作者是肖睿、蘭偉、廖春瓊。
《Hadoop構建數據倉庫與實戰分析》是2019年5月電子工業出版社出版的圖書,作者是小牛學堂。內容簡介 本書從Hadoop背景、特性、安裝等開始,逐步講解其配置、解決方案、元數據解析等內容。本書共10章,主要內容包括:Hadoop簡介,Hadoop的安裝...
《Hadoop大數據實戰權威指南(第2版)》是2019年9月電子工業出版社出版的圖書,作者是黃東軍。 內容簡介 基於深入分析組件原理、充分展示搭建過程、詳細指導套用開發”的理念,以最新版Hadoop及其生態組件為對象,採用理論與套用高度融合的...
《Cloudera Hadoop大數據平台實戰指南》是清華大學出版社2019年出版的圖書,作者是宋立桓、陳建平。內容簡介 本書分為18章,系統介紹Hadoop 生態系統大數據相關的知識,包括大數據概述、Cloudera Hadoop平台的安裝部署、HDFS分散式檔案系統、Map...
《Hadoop海量數據處理技術詳解與項目實戰(第2版)》是2015年人民郵電出版社出版的圖書,作者是范東來。圖書目錄 基礎篇:Hadoop基礎 第1章 緒論 2 1.1 Hadoop和雲計算 2 1.1.1 Hadoop的電梯演講 2 1.1.2 Hadoop生態圈 3...
《實戰Hadoop》是2011年電子工業出版社出版的圖書,作者是劉鵬。內容簡介 《實戰Hadoop》是中國電子學會雲計算專家委員會劉鵬教授主編的國內第一本原著的Hadoop編程技術書籍。它由電子工業出版社於2011年9月出版,並在首屆中國雲計算技術與...
《實戰Hadoop 2.0(第二版)——從雲計算到大數據》是2016年電子工業出版社出版的一本圖書,作者是葉曉江、劉鵬。內容簡介 書是劉鵬教授主編的國內第一本Hadoop編程書籍《實戰Hadoop》的第二版。Hadoop堪稱業界最經典的開源雲計算和大數...
《實戰Hadoop大數據處理》是2015年8月清華大學出版社出版的圖書,作者是曾剛。內容簡介 本書以“大數據”為起點,較詳細地介紹了Hadoop的相關知識。全書共分為9章,介紹了大數據的基本理論、Hadoop生態系統、Hadoop的安裝、HDFS分散式檔案...
3.3.5 配置Hadoop支持LZO壓縮 52 3.3.6 配置Hadoop支持Snappy壓縮 53 3.4 本章總結 54 第4章 用戶行為數據採集模組 55 4.1 日誌生成 55 4.2 採集日誌的Flume 57 4.2.1 Flume組件 58 4.2.2 Flume安裝 58 ...
第6章數據倉庫和Hadoop...93 6.1大數據時代的數據系統設計...94 6.1.1分散式系統上的CAP原理...94 6.1.2ACID和BASE概念的區別...95 6.1.3NoSQL...96 6.1.4各種數據源的整合...100 6.2傳統數據倉庫的瓶頸...101 6...
全書共14章,分為3篇,涵蓋的主要內容有Hadoop及其生態組件偽分散式安裝和完全分散式安裝、分散式檔案系統HDFS、分散式計算框架MapReduce、NoSQL資料庫HBase、分散式數據倉庫Hive、數據轉換工具Sqoop、記憶體計算框架Spark、海量Web日誌分析系統、...
7.5 配置Hadoop高可靠集群 106 7.6 用Java代碼操作集群 115 7.7 本章小結 117 第8章 數據倉庫Hive 118 8.1 Hive簡介 118 8.2 Hive3的安裝配置 120 8.2.1 使用Derby資料庫保存元數據 120 8.2.2 使用MySQL...
3.5.3 實戰:對分散式檔案系統(HDFS)使用SQL進行查詢.. 95 3.5.4 實戰:使用SQL查詢HBase資料庫.. 99 3.5.5 實戰:對數據倉庫(Hive)使用類實時統計、查詢操作.. 101 3.6 Spark——實時流數據計算.. 104 3.6.1...
第7章 Hadoop的數據倉庫Hive 220 7.1 Hive的安裝 220 7.1.1 準備的軟體包 220 7.1.2 內嵌模式安裝 220 7.1.3 安裝獨立模式 221 7.1.4 遠程模式安裝 222 7.1.5 查看數據信息 222 7.2 Hive的入口 223 7.2.1 類Cli...
《Hadoop生態體系項目實戰》是2019年天津大學出版社出版的圖書,作者是天津濱海迅騰科技集團有限公司。全書主要涉及八個項目,即Hadoop介紹、分散式檔案系統(HDFS)、強大的計算框架(Map Reduce)、數據倉庫工具(Hive)等內容。內容簡介 大數...
hive 並非為在線上事務處理而設計,hive 並不提供實時的查詢和基於行級的數據更新操作。hive 的最佳使用場合是大數據集的批處理作業,例如,網路日誌分析。設計特徵 hive 是一種底層封裝了Hadoop 的數據倉庫處理工具,使用類SQL 的hiveSQL ...
《數據倉庫與數據挖掘(Python+Hadoop+Hive)(微課視頻版)》是2023年清華大學出版社出版的圖書,作者是魏偉一、張國治、秦紅武。內容簡介 本書主要介紹數據倉庫與數據挖掘的基本概念和方法,包括數據預處理、數據倉庫與在線上分析處理、數據...
全書共 12 個項目,包括雲計算和大數據基礎概論、CentOS 的安裝與網路配置、MPI 集群部署及套用、Hadoop 集群部署及套用、MapReduce 基本原理及套用、HBase 資料庫的搭建及使用、Hive 數據倉庫的安裝及套用、Pig 數據分析、Sqoop 數據遷移...
7.3Flume數據採集套用 7.3.1採集目錄到HDFS 7.3.2採集檔案到HDFS 7.4項目實戰5:Flume之靜態攔 截器的使用 7.4.1案例場景 7.4.2場景分析 7.4.3數據流程處理分析 7.4.4開發實現 7.5本章小結 ●第8章分散式訊息系統Kafka...
第3 部分 數據探究 61 第5 章 使用Hadoop、Hive 和Shark 探索大規模數據集 63 5.1 什麼是數據倉庫 64 5.2 Apache Hive :在Hadoop 上進行互動式查詢 66 5.2.1 Hive 用例 66 5.2.2 Hive 實戰 67 5.2.3 在Hive 中使用...
10.1.2 數據倉庫的內涵 215 10.1.3 數據倉庫的基本組成 215 10.1.4 數據倉庫系統的體系結構 216 10.1.5 數據倉庫的建立 217 10.2 分散式數據倉庫系統 221 10.2.1 基於Hadoop的數據倉庫系統 221 10.2.2 Shark:基於...