HBase套用架構

HBase套用架構

《HBase套用架構》是一本2017年1中國電力出版社出版的圖書,作者[美]Jean-Marc,Spaggiari(吉恩-馬克?斯帕加里)、[美]Kevin,O'Dell(凱文?奧戴爾),本書共分為十八章,主要講解了HBase原理、集群部署以及套用。

基本介紹

  • 中文名:HBase套用架構
  • 作者:[美]Jean-Marc,Spaggiari(吉恩-馬克?斯帕加里)、[美]Kevin,O'Dell(凱文?奧戴爾)
  • 出版社:中國電力出版社
  • ISBN:9787519811211 
內容簡介,圖書目錄,作者簡介,

內容簡介

當對大量數據構建索引的時候,HBase是一個出色的工具,但是從零開始學習分散式資料庫及其生態系統是一件讓人望而卻步的事情。通過手把手的指導和對真實環境中案例的闡釋,你將學會如何架構、設計,以及部署你自己的HBase應用程式。除了HBase原理和集群部署指南之外,本書通過對案例的深入研究,展示了大型企業如何利用HBase解決具體問題的用例。本書提供了基本的解決方案和代碼示例來幫助你實現自己的用例,包括主數據管理(MDM)和檔案系統,以及準實時事件處理。你也能學習使用故障排除的方法來幫你避免部署時出現的一些問題。學習HBase能用來做什麼,其生態系統包括哪些組件以及如何搭建你的環境。探索現實世界中HBase實例如何部署並投入生產環境。查驗用於追蹤監控索賠的記錄用例,並診斷數據管理以及產品質量。理解HBase如何和Spark、kafka、MapReduce,以及Java API一起使用。學習如何識別*常見的HBase問題,並理解其結果。

圖書目錄

序 1
前言 3
部分 HBase概述
第1章什麼是HBase 11
面向列與面向行 13
實現和使用示例 13
第2章 HBase原理 15
表格式列族 15
表的內部操作 22
依賴 27
HBase 角色 27
第3章 HBase生態系統 32
監控工具 32
SQL 40
框架 42
第4章 HBase規模預估和調優概述 45
硬體 46
存儲 46
網路 47
作業系統調優 48
Hadoop調優 49
HBase調優 50
負載不均調優 52
第5章環境設定 54
系統要求 55
HBase單機安裝 58
虛擬機中的HBase 61
本地與VM 62
故障排除 63
步 65
偽分散式模式和全分散式模式 73
第二部分 用例
第6章用例:HBase作為一個記錄系統 77
攝取/預處理 78
處理/服務 79
用戶體驗 84
第7章底層存儲引擎的實現 87
表設計 87
數據轉換 92
HFile校驗 98
批量載入 99
數據索引 104
數據檢索 107
更進一步 109
第8章用例:近實時事件處理 111
攝取/預處理 114
近實時事件處理 115
處理/服務 116
第9章近實時實現事件處理 119
套用流 121
實施 125
進一步 144
第10章用例:HBase作為主數據管理工具 145
攝取 146
處理 148
第11章主數據管理工具HBase的實現 150
MapReduce與Spark 150
Spark與HBase互動 151
Spark結合HBase實現 152
進一步 162
第12章用例:文檔存儲 163
數據服務 165
數據攝取 166
清理 168
第13章文檔存儲的實現 169
MOB 169
數據一致性 174
進一步 175
第三部分疑難問題的定位和排錯
第14章 region 過多 179
後果 179
原因 180
解決方案 181
防範 188
第15章列族過多 191
後果 192
原因、解決方案和預防 193
第16章熱點 196
後果 196
原因 196
防範和解決方案 200
第17章逾時和垃圾回收 201
後果 201
原因 203
解決方案 205
預防 205
第18章 HBCK和不一致 210
HBase檔案系統布局 210
查看META 表 211
在HDFS上查看HBase 212
HBCK概述 214
使用HBCK 215

作者簡介

Jean-Marc Spaggiari,自2012年來是HBase的contributor,作為Cloudera 的HBase精通解決方案架構師,他一直從事著Hadoop和HBase的技術支持和諮詢工作。他曾經與北美洲一些*的HBase用戶一起工作。Kevin O'Dell,自2012年來是HBase的contributor,作為Rocana的現場工程師,他和客戶一起設計並完成大規模的IT運營。此外,他還在HBaseCon、HadoopSummit及一些Hadoop用戶組做過分享。

相關詞條

熱門詞條

聯絡我們