Hive實戰

內容簡介

Hive“出身名門”，是最初由Facebook公司開發的數據倉庫工具。它簡單且容易上手，是深入學習Hadoop技術的一個很好的切入點。本書由資料庫專家和大數據專家共同撰寫，具體內容包括：Hive的安裝和配置，其核心組件和架構，Hive數據操作語言，如何載入、查詢和分析數據，Hive的性能調優以及安全性，等等。本書旨在為讀者打牢基礎，從而踏上專業的大數據處理之旅。

圖書目錄

第 1章為Hive打好基礎：Hadoop 1

1.1　一隻小象出生了　2

1.2　Hadoop的結構　3

1.3　數據冗餘　6

1.3.1　傳統的高可用性　6

1.3.2　Hadoop的高可用性　9

1.4　MapReduce處理　12

1.4.1　超越MapReduce　16

1.4.2　YARN和現代數據架構　17

1.4.3　Hadoop 和開源社區　19

1.4.4　我們身在何處　22

第　2 章 Hive 簡介　24

2.1　Hadoop 發行版　25

2.2　集群架構　27

2.3　Hive 的安裝　30

2.4　探尋你的方式　32

2.5　Hive CLI　35

第3　章 Hive架構　37

3.1　Hive組件　37

3.2　HCatalog　38

3.3　HiveServer2　40

3.4　客戶端工具　42

3.5　執行引擎：Tez　46

第4　章 Hive表DDL　48

4.1　schema-on-read　48

4.2　Hive數據模型　49

4.2.1　模式/資料庫　49

4.2.2　為什麼使用多個模式/資料庫　49

4.2.3　創建資料庫　49

4.2.4　更改資料庫　50

4.2.5　刪除資料庫　50

4.2.6　列出資料庫　51

4.3　Hive中的數據類型　51

4.3.1　基本數據類型　51

4.3.2　選擇數據類型　51

4.3.3　複雜數據類型　52

4.4　表　53

4.4.1　創建表　53

4.4.2　列出表　54

4.4.3　內部表/外部表　54

4.4.4　內部表/受控表　55

4.4.5　內部表/外部表示例　55

4.4.6　表的屬性　59

4.4.7　生成已有表的CREATE TABLE命令　60

4.4.8　分區和分桶　61

4.4.9　分區注意事項　63

4.4.10　對日期列進行高效分區　63

4.4.11　分桶的注意事項　65

4.4.12　更改表　66

Hive實戰

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條