HBase入門與實踐

HBase入門與實踐

《HBase入門與實踐》是2020年2月人民郵電出版社出版的圖書,作者是彭旭。

基本介紹

  • 中文名:HBase入門與實踐
  • 作者:彭旭
  • 出版社:人民郵電出版社
  • 出版時間:2020年2月
  • 頁數:212 頁
  • 定價:59 元
  • 開本:16 開
  • 裝幀:平裝
  • ISBN:9787115493835
內容簡介,圖書目錄,

內容簡介

本書以精練的語言介紹HBase的基礎知識,讓初學者能夠快速上手使用HBase,對HBase的核心思想(如數據讀取、數據備份等)和HBase架構(如LSM樹、WAL)有深入的分析,並且讓有經驗的HBase開發人員也能夠循序漸進地深入理解HBase源碼,以便更好地去調試和解決線上遇到的各種問題。本書更加專注於HBase線上實時系統的調優,使HBase集群回響延遲更低。本書結合企業必備的“用戶行為分析系統”,讓讀者能夠快速上手的同時,也不乏企業HBase實際套用場景,理論不脫離實際,真正做到從入門到精通。
本書適合有一定Java基礎的程式設計師作為HBase入門教程,HBase運維人員可以將本書作為參考手冊來部署和監控HBase,正在將HBase套用到線上生產環境中的軟體開發人員也可以參考本書來調優HBase線上集群性能。

圖書目錄

第1章 HBase簡介 1
1.1 背景 1
1.2 NoSQL與傳統RDBMS 2
1.3 套用場景 3
1.3.1 Facebook用戶互動數據 3
1.3.2 淘寶TLog等 3
1.3.3 小米雲服務 4
1.3.4 用戶行為數據存儲 4
第2章 HBase安裝 5
2.1 單機部署 5
2.1.1 前置條件 5
2.1.2 下載HBase 6
2.1.3 配置HBase 6
2.1.4 啟動HBase 6
2.1.5 HBase初體驗 7
2.2 分散式部署 8
2.2.1 環境準備 9
2.2.2 ZooKeeper安裝 11
2.2.3 Hadoop安裝 12
2.2.4 HBase安裝 23
2.2.5 啟動集群 28
2.3 集群增刪節點 29
2.3.1 增加節點 29
2.3.2 刪除節點 30
第3章 HBase數據模型 33
3.1 邏輯模型 33
3.2 物理模型 35
第4章 HBase shell 39
4.1 數據定義語言 39
4.1.1 創建表 39
4.1.2 查看所有表 40
4.1.3 查看建表 40
4.1.4 修改表 41
4.2 數據操縱語言 41
4.2.1 Put 41
4.2.2 Get 42
4.2.3 Scan 43
4.2.4 刪除數據 45
4.3 其他常用shell 46
4.3.1 複製狀態查看 46
4.3.2 分區拆分 47
4.3.3 分區主壓縮 47
4.3.4 負載均衡開關 48
4.3.5 分區手動遷移 48
第5章 模式設計 49
5.1 行鍵設計 50
5.2 規避熱點區間 52
5.3 高表與寬表 54
5.4 微信朋友圈設計 55
5.4.1 需求定義 55
5.4.2 問題建模 55
第6章 客戶端API 61
6.1 Java客戶端使用 61
6.2 數據定義語言 64
6.2.1 表管理 64
6.2.2 分區管理 66
6.3 數據操縱語言 68
6.3.1 Put 68
6.3.2 Get 70
6.3.3 Scan 72
6.3.4 Delete 74
6.3.5 Increment 76
6.4 過濾器 78
6.4.1 過濾器簡介 78
6.4.2 過濾器使用 81
6.5 事務 94
6.5.1 原子性 95
6.5.2 隔離性 95
第7章 架構實現 101
7.1 存儲 101
7.1.1 B+樹 101
7.1.2 LSM樹 102
7.1.3 WAL 104
7.2 數據寫入讀取 107
7.2.1 定位分區伺服器 107
7.2.2 數據修改流程 108
7.2.3 數據查詢流程 113
第8章 協處理器 115
8.1 觀察者類型協處理器 115
8.2 端點類型協處理器 132
8.3 裝載/卸載協處理器 136
8.3.1 靜態裝載/卸載 136
8.3.2 動態裝載/卸載 137
第9章 HBase性能調優 141
9.1 客戶端調優 141
9.1.1 設定客戶端寫入快取 141
9.1.2 設定合適的掃描快取 143
9.1.3 跳過WAL寫入 143
9.1.4 設定重試次數與間隔 144
9.1.5 選用合適的過濾器 144
9.2 服務端調優 145
9.2.1 建表DDL最佳化 145
9.2.2 禁止分區自動拆分與壓縮 150
9.2.3 開啟機櫃感知 151
9.2.4 開啟Short Circuit Local Reads 153
9.2.5 開啟補償重試讀 154
9.2.6 JVM記憶體調優 155
第10章 集群間數據複製 163
10.1 複製 164
10.1.1 集群拓撲 165
10.1.2 配置集群複製 166
10.1.3 驗證複製數據 169
10.1.4 複製詳解 171
10.2 快照 175
10.2.1 配置快照 176
10.2.2 管理快照 176
10.3 導出和導入 178
10.3.1 導出 178
10.3.2 導入 180
10.4 複製表 180
第11章 監控 183
11.1 Hadoop監控 183
11.1.1 Web監控頁面 184
11.1.2 JMX監控 185
11.2 HBase監控 188
11.2.1 Web監控頁面 188
11.2.2 JMX監控 190
11.2.3 API監控 192
後記 195
附錄 常見問題 197

相關詞條

熱門詞條

聯絡我們