《Hive數據倉庫技術與套用》是2020年中國鐵道出版社出版的圖書。
基本介紹
- 中文名:Hive數據倉庫技術與套用
- 作者:朱曉彥,方明清,李強
- 出版時間:2020年
- 出版社:中國鐵道出版社
- ISBN:9787113271947
- 類別:計算機類圖書
- 開本:16 開
- 裝幀:平裝-膠訂
《Hive數據倉庫技術與套用》是2020年中國鐵道出版社出版的圖書。
hive數據倉庫工具能將結構化的數據檔案映射為一張資料庫表,並提供SQL查詢功能,能將SQL語句轉變成MapReduce任務來執行。Hive的優點是學習成本低,可以通過類似SQL語句實現快速MapReduce統計,使MapReduce變得更加簡單,而不必開發專門的MapReduce套用程式。hive十分適合對數據倉庫進行統計分析。簡介 hive是基於Hadoop構建的...
《數據倉庫技術及套用》是2022年機械工業出版社出版的書籍,作者是劉學、杜恆。內容簡介 本書詳細介紹了數據倉庫的基本概念和Hive數據倉庫的架構原理,並採用“項目驅動+理論介紹+微實例+實際代碼+運行效果”的模式介紹項目案例。全書包括崗前培訓和8個項目,主要內容包括數據倉庫環境部署、基於DDL的學員信息系統操作、...
《Hive數據倉庫套用》是清華大學出版社2021年出版的書籍。內容簡介 本書從理論知識入手,結合數據倉庫的概念幫助讀者更好地理解Hive,在掌握Hive相關理論知識的基礎上,逐步深入地學習Hive。“工欲善其事,必先利其器”,首先從創建虛擬機並安裝Linux作業系統開始逐步完成Hive的部署,然後在部署完成的Hive環境基礎上,...
《HBase與Hive數據倉庫套用開發》是電子工業出版社出版的圖書,作者是唐美霞,許建豪,賈瑞民。內容簡介 本書使用大數據存儲常用工具與真實場景案例相結合的方式,以項目任務式為導向,較為全面地介紹了HBase分散式資料庫與Hive分散式數據倉庫的相關知識。全書共9個項目,內容包括認識資料庫與數據倉庫、安裝與配置HBase列...
1.1.3數據倉庫的組成 1.1.4數據倉庫的套用 1.1.5基於Hadoop/Spark的數據倉庫技術 1.2數據挖掘概述 1.2.1數據挖掘的概念 1.2.2數據挖掘的主要任務 1.2.3數據挖掘的數據源 1.2.4數據挖掘使用的技術 1.2.5數據挖掘存在的主要問題 1.2.6數據挖掘建模的常用工具 1.2.7Python數據...
Hive數據倉庫案例教程 《Hive數據倉庫案例教程》是2021年電子工業出版社出版的圖書,作者是王劍輝、於澗。
本書可作為Hive數據倉庫初學者的入門書,也可作為Hive大數據分析與大數據套用開發工程師的指導手冊,還可作為高等院校或者高職高專計算機技術、人工智慧、大數據技術及相關專業的教材或教學參考書。圖書目錄 第1章 數據倉庫與Hive1 1.1 數據倉庫概述1 1.1.1 數據倉庫特徵與重要概念1 1.1.2 數據倉庫的數據...
本書向讀者介紹大數據治理與安全的基本概念和相應的技術套用。本書共9章,內容分別為數據治理概述、數據採集與數據道德、數據質量與數據管理、數據交換與數據集成、資料庫設計與治理、架構設計與治理、數據倉庫設計與治理、大數據安全與治理及綜合實訓。本書將理論與實踐操作相結合,通過大量的案例幫助讀者快速了解和套用...
基礎篇包括大數據概論、大數據集群系統基礎、Hadoop分散式系統、HDFS分散式檔案系統、MapReduce分散式計算、HBase分散式資料庫套用; 核心篇包括YARN資源分配、Spark集群計算、Spark機器學習、Hive數據倉庫套用、ZooKeeper協調服務; 套用篇包括醫藥大數據案例分析。 本書可以作為高等院校大數據技術相關課程本科生教材,也可以作為...
培養學生信息的感知能力,能夠通過科學技術感知信息世界;激發學生學習與製造能力,在學習數據過程中進行數據再造。適應專業 大數據技術與套用課程適用信息管理等專業學習。開課信息 (註:表格內容參考資料)課程簡介 大數據技術與套用課程介紹了大數據的關鍵技術;Hive數據倉庫基本操作;Hbase數據倉庫載入;大數據可視化常用...
《高等學校大數據技術與套用規劃教材:Hadoop大數據分析》是2019年7月1日中國鐵道出版社出版的圖書,作者是高永彬、錢亮宏、方誌軍。內容簡介 本書從Hadoop的原理和使用出發,在重點介紹Hadoop生態系統的重要組件HDFS、MapReduce、YARN、Hive和Spark的同時,注重大數據分析能力的全面提高。本書共分13章,主要內容包括Had...
全書共 12 個項目,包括雲計算和大數據基礎概論、CentOS 的安裝與網路配置、MPI 集群部署及套用、Hadoop 集群部署及套用、MapReduce 基本原理及套用、HBase 資料庫的搭建及使用、Hive 數據倉庫的安裝及套用、Pig 數據分析、Sqoop 數據遷移、Flume 日誌收集系統、Spark 部署及數據分析、大數據技術編程實例。本書秉承“...
《Hadoop大數據技術與套用》是2019年12月人民郵電出版社出版的圖書,作者是楊治明、許桂秋。內容簡介 本書採用理論與實踐相結合的方式,全面介紹了Hadoop大數據技術。主要內容包括初識Hadoop大數據技術、Hadoop環境配置,分散式檔案系統HDFS、資源調度框架YARN、分散式計算框架MapReduce、大數據數據倉庫Hive、分散式資料庫HBase、...
3.3 大數據查詢和分析技術 133 3.3.1 Hive:基本的Hadoop查詢和分析 134 3.3.2 Hive 2.0:Hive的最佳化和升級 144 3.3.3 實時互動的SQL:Impala和drill 147 3.3.4 基於PostgreSQL的SQL on Hadoop 153 3.4 大數據高級分析和可視化技術 154 3.4.1 傳統數據倉庫與在線上分析處理技術 154 3.4.2 大數據對...
全書分為9章,全面介紹了大數據技術的相關基礎知識、HDFS和資料庫、採集傳輸工具、挖掘分析算法、Spark計算框架、可視化、大數據安全、大數據套用等內容,著重介紹了HDFS分散式檔案系統、NoSQL等各種資料庫、數據倉庫Hive,以及數據採集分析技術,並配套了詳細的實驗教程以及練習題。本書適合作為高等院校計算機、軟體工程、...
本書系統介紹了Hadoop生態系統的核心開發技術,包括:Hadoop大數據技術概述、Hadoop開發及運行環境搭建、HDFS分散式檔案系統、MapReduce分散式計算技術框架、Hadoop的檔案I/O以及YARN資源管理器、Zookeeper分散式協調服務、Hadoop分散式集群搭建與管理、Hive 數據倉庫和HBase分散式資料庫、Hadoop生系系統常用開發技術,並通過廣電...
第7章 大數據倉庫套用技術 147 7.1 Hive基礎知識 148 7.1.1 Hive產生背景 148 7.1.2 Hive體系結構 148 7.1.3 Hive執行流程 150 7.1.4 Hive套用場景 151 7.2 Hive開發環境配置 151 7.2.1 Hive配置基礎知識 151 7.2.2 Hive安裝模式 151 7.2.3 Hive遠程安裝模式實戰 153 7.3...
第7章數據倉庫Hive 72 7.1Hive簡介 72 7.2Hive體系架構和套用場景 73 7.2.1Hive體系架構 73 7.2.2Hive套用場景 74 7.3Hive的數據模型 75 7.3.1內部表 75 7.3.2外部表 75 7.3.3分區表 75 7.3.4桶 75 7.4Hive實戰操作 76 7.4.1Hive內部表操作 77 7.4.2Hive外部表操作 77 7.4.3...
《大數據基礎》是2019年大連理工大學出版社出版的教材,作者是周晴紅。本教材共9個項目,主要內容包括:大數據概述、Linux作業系統的安裝及常用命令、Hadoop集群部署、HDFS基礎操作、HBase資料庫的安裝與套用、MapReduce套用開發、Hive數據倉庫、Flume和Sqoop的安裝與使用、數據可視化技術。內容簡介 《大數據基礎》是新世紀...
本書系統介紹了大數據的相關知識,分為大數據基礎篇、大數據存儲與管理篇、大數據處理與分析篇、大數據套用篇。全書共17章,內容包含大數據的基本概念、大數據處理架構Hadoop、分散式檔案系統HDFS、分散式資料庫HBase、NoSQL資料庫、雲資料庫、MapReduce、數據倉庫Hive、Spark、流計算、Flink、圖計算、數據可視化以及大數據在...
李春靜,工學碩士,現任北京華育興業科技有限公司大數據講師,並承擔高校大數據技術與套用資源建設工作。主要從事Hadoop、HBase、Hive、Spark、大資料庫、機器學習等課程研發工作。研究興趣為大數據套用、機器學習和智慧型自動化。曾以首作者在國核心心期刊上發表論文2篇,參與大型煤礦信息化項目1個、國家醫療大數據項目2個。參...
《Hadoop理論與實踐》主要包含四大部分:Hadoop技術、數據倉庫與Hive、Flume分散式日誌處理系統、Spark及其生態圈概述。其中,Hadoop技術包括大數據與數據分析、Hadoop生態系統介紹、Hadoop存儲、Hadoop計算之MapReduce、Hadoop安全等;數據倉庫與Hive包括Hive與資料庫的基礎知識、Hive的高級特性、Hive最佳化及案例的套用;Flume分布...