《Hadoop構建數據倉庫與實戰分析》是2019年5月電子工業出版社出版的圖書,作者是小牛學堂。
基本介紹
- 中文名:Hadoop構建數據倉庫與實戰分析
- 作者:小牛學堂
- 出版社:電子工業出版社
- 出版時間:2019年5月
- 頁數:248 頁
- 定價:49 元
- 開本:16 開
- ISBN:9787121365393
《Hadoop構建數據倉庫與實戰分析》是2019年5月電子工業出版社出版的圖書,作者是小牛學堂。
《Hadoop大數據實戰權威指南(第2版)》是2019年9月電子工業出版社出版的圖書,作者是黃東軍。 內容簡介 基於深入分析組件原理、充分展示搭建過程、詳細指導套用開發”的理念,以最新版Hadoop及其生態組件為對象,採用理論與套用高度融合的...
hive是基於Hadoop構建的一套數據倉庫分析系統,它提供了豐富的SQL查詢方式來分析存儲在Hadoop分散式檔案系統中的數據:可以將結構化的數據檔案映射為一張資料庫表,並提供完整的SQL查詢功能;可以將SQL語句轉換為MapReduce任務運行,通過自己的...
《Hadoop+Spark大數據分析實戰》是清華大學出版社於2022年出版的書籍,作者是遲殿委。內容簡介 本書是Hadoop + Spark大數據分析技術入門書,基於Hadoop和Spark兩大框架體系的3.2版本,以通俗易懂的方式介紹Hadoop + Spark原生態組件的原理、...
《大數據分析——數據倉庫項目實戰》是2020年9月電子工業出版社出版的圖書,作者是尚矽谷IT教育。中文名 大數據分析——數據倉庫項目實戰 別名 數據倉庫項目實戰 作者 尚矽谷IT教育 出版時間 2020年9月 出版社 電子工業出版社 ...
《Kettle構建Hadoop ETL系統實踐》是清華大學出版社出版的圖書 。內容簡介 本書介紹並演示如何用Kettle完成Hadoop數據倉庫上的ETL過程,所有的描繪場景與實驗環境都是基於Linux作業系統的虛擬機。全書共分10章,主要內容包括ETL與Kettle的基本...
從零開始學Hadoop大數據分析(視頻教學版)》一書由機械工業出版社出版發行。內容簡介 本書全面介紹了Hadoop大數據分析的基礎知識、14個核心組件模組及4個項目實戰案例。為了幫助讀者高效、直觀地學習,作者特意為本書錄製了20小時同步配套...
HDFS分散式檔案系統、MapReduce分散式計算技術框架、Hadoop的檔案I/O以及YARN資源管理器、Zookeeper分散式協調服務、Hadoop分散式集群搭建與管理、Hive 數據倉庫和HBase分散式資料庫、Hadoop生系系統常用開發技術,並通過廣電收視率數據統計分析和...
《Hive入門與大數據分析實戰》是清華大學出版社出版的一本圖書,作者是遲殿委。內容簡介 Hive是基於Hadoop的一個數據倉庫工具,用來進行數據的提取、轉換、載入,這是一種可以存儲、查詢和分析存儲在Hadoop中的大規模數據的機制。Hive能將...
7.2.2 查看Hadoop JIRA212 7.2.3 閱讀相關源碼213 7.3 實戰案例分析216 7.3.1 案例分析1:啟動HBase失敗216 7.3.2 案例分析2:HBase表查詢失敗219 7.3.3 案例分析3:Spark的臨時數據不自動清理222 7....
《Hadoop生態體系項目實戰》主要涉及八個項目,即Hadoop介紹、分散式檔案系統(HDFS)、強大的計算框架(Map Reduce)、數據倉庫工具(Hive)、分散式資料庫(HBase)、數據遷移工具(Sqoop)、日誌收集系統(Flume)、構建Persona項目,嚴格...
《實戰大數據(Hadoop+Spark+Flink)——從平台構建到互動式數據分析(離線/實時)》詳細介紹了大數據工程師在實際工作中應該熟練掌握的大數據技術。全書共8章,分別是大數據技術概述、搭建IDEA開發環境及Linux虛擬機、基於Hadoop構建大數據平台...
7.3Flume數據採集套用 7.3.1採集目錄到HDFS 7.3.2採集檔案到HDFS 7.4項目實戰5:Flume之靜態攔 截器的使用 7.4.1案例場景 7.4.2場景分析 7.4.3數據流程處理分析 7.4.4開發實現 7.5本章小結 ●第8章分散式訊息系統Kafka...
.172.1.4 搭建 Hadoop 集群前的準備工作 ···.19 【任務實施】 ···.19【任務實訓】 ···
著有圖書《Greenplum構建實時數據倉庫實踐》《Hadoop構建數據倉庫實踐》《HAWQ數據倉庫與數據挖掘實戰》《SQL機器學習庫MADlib技術解析》《MySQL高可用實踐》。目錄 第1章 數據倉庫簡介 1 1.1 什麼是數據倉庫 1 1.1.1 數據倉庫的...
2.4 安裝Hadoop 21 2.4.1 克隆並啟動虛擬機 21 2.4.2 網路基本配置 24 2.4.3 安裝JDK 27 2.4.4 免密鑰登錄配置 28 2.4.5 Hadoop配置 29 2.4.6 配置從節點 33 2.4.7 配置系統檔案 33 2.4.8 啟動Hadoop集群 ...
也簡單介紹了Hadoop 生態系統中的Mahout; 第2 ~7 章按知識發現的過程, 介紹數據預處理的方法和技術、數據倉庫的構建與OLAP 技術、數據挖掘原理及算法(包括關聯規則挖掘、聚類分析方法、分類規則挖掘)、常見的數據挖掘工具與產品...
3.1.3 企業大數據系統的數據倉庫工具12 3.1.4 企業大數據系統的分析計算工具13 3.1.5 企業大數據系統的資料庫工具13 3.2 大數據系統各組件安裝部署配置13 3.2.1 安裝的前期準備工作13 3.2.2 Hadoop基礎環境安裝及配置15 ...
第3 部分 數據探究 61 第5 章 使用Hadoop、Hive 和Shark 探索大規模數據集 63 5.1 什麼是數據倉庫 64 5.2 Apache Hive :在Hadoop 上進行互動式查詢 66 5.2.1 Hive 用例 66 5.2.2 Hive 實戰 67 5.2.3 在Hive ...
第7章 Hadoop數據倉庫開發實戰 111 7.1 業務需求 112 7.2 Hadoop數據倉庫架構設計 113 7.3 Hadoop數據倉庫規範設計 114 7.3.1 命名規範 115 7.3.2 開發規範 115 7.3.3 流程規範 116 7.4 FutureRetailer數據倉庫構建...
第3 部分 數據探究 61 第5 章 使用Hadoop、Hive 和Shark 探索大規模數據集 63 5.1 什麼是數據倉庫 64 5.2 Apache Hive :在Hadoop 上進行互動式查詢 66 5.2.1 Hive 用例 66 5.2.2 Hive 實戰 67 5.2.3 在Hive 中使用...
第3部分 數據探究 61 第5章 使用Hadoop、Hive 和Shark 探索大規模數據集 63 5.1 什麼是數據倉庫 64 5.2 Apache Hive :在Hadoop 上進行互動式查詢 66 5.2.1 Hive 用例 66 5.2.2 Hive 實戰 67 5.2.3 在Hive 中使用...
4.5.2 典型案例分析 331 第5章 數據分析 337 本章主要介紹和解決如下問題:分散式系統中日誌收集系統的架構。如何通過Storm進行實時的流式數據分析。如何通過Hadoop進行離線數據分析,通過Hive建立數據倉庫。如何將關係型資料庫中存儲的...