《HBase管理指南》是2017年8月人民郵電出版社出版的圖書,作者是蔣燚峰。
基本介紹
- 中文名:HBase管理指南
- 作者:蔣燚峰
- ISBN:9787115319814
- 頁數:297頁
- 定價:59元
- 出版社:人民郵電出版社
- 出版時間:2017年8月
- 裝幀:平裝
- 開本:小16開
《HBase管理指南》是2017年8月人民郵電出版社出版的圖書,作者是蔣燚峰。
《HBase權威指南》是2012年4月東南大學出版社出版的圖書,作者是喬治。內容簡介 《HBase權威指南(影印版)(英文版)》探討了與Hadoop的高度集成如何使HBase的可伸縮性變得簡單;把大型數據集分布到相對廉價的商業伺服器集群中;使用本地Java客戶端,或者通過提供了REST、Avro和Thrift套用編程接口的網關伺服器來訪問HBase...
《HBase實戰》是一本基於經驗提煉而成的指南,它教給讀者如何運用HBase設計、搭建及運行大數據套用系統。全書共分為4個部分。前兩個部分分別介紹了分散式系統和大規模數據處理的發展歷史,講解HBase的基本原理模式設計以及如何使用HBase的高級特性;第三部分通過真實的套用和代碼示例以及支持這些實踐技巧的理論知識,...
4.2 HBase客戶端避坑指南 第5章RegionServer的核心模組 5.1 RegionServer內部結構 5.2 HLog 5.2.1 HLog檔案結構 5.2.2 HLog檔案存儲 5.2.3 HLog生命周期 5.3 MemStore 5.3.1 MemStore內部結構 5.3.2 MemStore的GC問題 5.3.3 MSLAB記憶體管理方式 5.3.4 MemStore Chunk Pool 5.3.5 MSLAB相關...
設計、構建和管理專用的Hadoop集群或在雲上運行Hadoop 使用Pig這種高級的查詢語言來處理大規模數據 利用HBase這個Hadoop資料庫來處理結構化和半結構化數據 學習Zookeeper,這是一個用於構建分散式系統的協作原語工具箱 如果您擁有海量數據,無論是GB級還是PB級,Hadoop都是完美的選擇。本書是這方面最全面的參考。圖書目錄...
《Hadoop權威指南(第2版)》是2011年清華大學出版社出版的圖書,作者是Tom White。 內容簡介 本書從Hadoop的緣起開始,由淺入深,結合理論和實踐,全方位地介紹Hadoop這一高性能處理海量數據集的理想工具。全書共16章,3個附錄,涉及的主題包括:Haddoop簡介;MapReduce簡介;Hadoop分散式檔案系統;Hadoop的I/O、Map...
17.3 HBase 227 17.4 Cassandra 229 17.4.1 靜態列映射(Static Column Mapping) 229 17.4.2 為動態列轉置列映射 229 17.4.3 Cassandra SerDe Properties 229 17.5 DynamoDB 230 第 18章 安全 232 18.1 和Hadoop安全功能相結合 233 18.2 使用Hive進行驗證 233 18.3 Hive中的許可權管理...
第Ⅲ部分介紹Hadoop的運維,主題涉及構建Hadoop集群、管理Hadoop。第Ⅳ部分介紹Hadoop相關開源項目,主題涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三個案例,分別來自醫療衛生信息技術服務商塞納(Cerner)、微軟的人工智慧項目ADAM(一種大規模分散式深度學習框架)和開源項目...
12.5 Hoya:HBase on YARN 208 12.6 Dryad on YARN 208 12.7 Apache Spark 208 12.8 Apache Storm 209 12.9 REEF:Retainable Evaluator Execution Framework 209 12.10 Hamster:Hadoop and MPI on the Same Cluster 210 12.11 小結 210 附錄A 補充內容和代碼下載 211 附錄B YARN的安裝腳本 ...
本書分為18章,系統介紹Hadoop 生態系統大數據相關的知識,包括大數據概述、Cloudera Hadoop平台的安裝部署、HDFS分散式檔案系統、MapReduce計算框架、資源管理調度框架YARN 、Hive數據倉庫、數據遷移工具Sqoop、分散式資料庫HBase、ZooKeeper分散式協調服務、準實時分析系統Impala、日誌採集工具Flume、分散式訊息系統Kafka、ETL工具...
4.5 Hadoop統一資源管理框架YARN 48 4.6 Hadoop分散式計算框架MapReduce 52 4.7 Hadoop分散式集群管理系統ZooKeeper 57 第5章 Hadoop其他常用組件 61 5.1 Hadoop數據倉庫工具Hive 62 5.2 Hadoop分散式資料庫 HBase 65 5.3 Hadoop實時流處理引擎 Storm 70 5.4 Hadoop互動式查詢引擎 Impala 74 5.5 其他常用...
本書通過9章內容,循序漸進地揭示了大數據的概念,介紹了如何使用R進行數據處理,如何創建Hadoop虛擬機,如何建立和部署SQL資料庫,同時還介紹了MongoDB、HBase、Spark、Hive相關的內容,並介紹了R的潛在套用場景。本書適合中級數據分析師、數據工程師、統計學家、研究人員和數據科學家閱讀,需要讀者具備數據分析、數據...
拓展知識中首先講解了Solr的一些比較生僻的知識點,如偽域、多語種索引支持、安全認證,以及Solr 6.x中的SQL接口和Streaming表達式等;然後講解了Solr與MapReduce、HDFS、Hbase、Kafka、Flume、Storm、Spark等大數據技術的結合使用的集成方法。圖書目錄 序言 第1章 初識Solr 1 1.1 Solr是什麼 1 1.2 Solr的歷史 ...
Hadoop是重要的大數據技術,本章詳細介紹了Hadoop的三大核心技術,即分散式檔案系統HDFS、分散式計算框架MapReduce、分散式資料庫HBase的技術原理、技術構成和套用示例,也詳細介紹了Spark等記憶體計算及Storm等流計算框架。針對大數據查詢和分析,本章介紹了SQL on Hadoop技術,包括Hive、Impala等。大數據高級分析和可視化技術...
《大數據:技術與套用實踐指南》是2013年電子工業出版社出版的圖書,作者是趙 剛。內容簡介 大數據是網際網路、移動套用、社交網路和物聯網等技術發展的必然趨勢,大數據套用成為當前最為熱門的信息技術套用領域。本書由淺入深,首先概述性地分析了大數據的發展背景、基本概念,從業務的角度分析了大數據套用的主要業務價值...
11.4 日誌管理系統的案例 186 11.4.1 系統建設目標 186 11.4.2 使用 Flume 建立日誌傳輸管道 187 11.4.3 日誌檔案的保存和 HBase 日誌索引的創建 188 11.4.4 關於日誌規範 189 11.5 日誌管理的價值分析 189 11.5.1 系統運行監控 189 11.5.2 違規分析 189 11.5.3 用戶行為分析 190 第 3 篇 ...
全書共16章,3個附錄,涉及的主題包括:Haddoop;MapReduce;Hadoop分散式檔案系統;Hadoop的I/O、MapReduce應用程式開發;MapReduce的工作機制;MapReduce的類型和格式;MapReduce的特性;如何構建Hadoop集群,如何管理Hadoop;Pig;HBase;Hive;ZooKeeper;開源工具Sqoop,最後還提供了豐富的案例分析。本書是Hadoop權威參考...
3.3.3 Hbase常用命令 3.4 數據搜尋 3.4.1 Elasticsearch基本概念 3.4.2 副本複製機制 3.4.3 映射和分詞 3.4.4 映射管理 3.4.5 索引管理命令 3.4.6 搜尋 3.4.7 聚合分析 3.5 實時計算引擎 3.5.1 基本概念 3.5.2 主流的大數據流計算引擎 3.5.3 Apache Flink 3.6 批量計算引擎 3.6.1...
《Hadoop雲計算實戰》是2012年清華大學出版社出版的圖書,作者是周品。本書全面介紹了雲計算的基本概念、Google(谷歌)雲計算的關鍵技術,以及Hadoop雲計算的相關配套項目及其實戰。內容介紹 《Hadoop雲計算實戰》內容包括Hadoop的HDFS、MapReduce、HBase、Hive、Pig、Cassandra、Chukwa及ZooKeeper等配套項目的實現機制、用法...
Spark的作業管理 61 Spark的執行過程 62 BigTable的開源實現:HBase 63 HBase可伸縮架構 64 HBase可擴展數據模型 65 HBase的高性能存儲 66 流式計算的代表:Storm、Spark Streaming、Flink 68 Storm 68 Spark Streaming 70 Flink 71 ZooKeeper是如何保證數據一致性的 74 分散式一致性原理 75 Paxos算法與ZooKeeper...
9NoSQL資料庫HBase(128)9.1HBase體系結構(128)9.2RowKey的設計與數據訪問(132)9.3過濾器(135)9.3.1比較過濾器(137)9.3.2專用過濾器(137)9.3.3附加過濾器(139)9.3.4FilterList(139)9.3.5自定義過濾器(140)9.4HBase多維數據訪問(142)9.4.1通過Filter實現(142)9.4.2通過設計RowKey實現(143)...
5.2.3 列資料庫——HBase 5.3 快取 5.3.1 本地快取 5.3.2 分散式快取——Redis 5.3.3 快取設計的典型方案 5.4 搜尋引擎——Elasticsearch 5.4.1 開源全文檢索庫——Apache Lucene 5.4.2 關鍵概念 5.4.3 查詢的最佳化 5.4.4 記憶體的使用最佳化 5.4.5 開源日誌管理方案——ELK 第6章 數據通信 ...
第4章 大數據管理 4.1 概述 4.2 Hadoop 介紹 4.2.1 HDFS 4.2.2 MapReduce 4.2.3 HBase 4.2.4 Pig 4.2.5 Hive 4.2.6 Jaql 4.2.7 其他Hadoop 組件 4.3 IBM 大數據平台 4.3.1 InfoSphere BigInsights 4.3.2 InfoSphere Streams 4.3.3 Data Explorer 4.3.4 PureData System for ...
7.4 HDFS管理操作 (205)7.4.1 許可權管理 (205)7.4.2 配額管理 (207)7.4.3 檔案歸檔 (207)7.5 FS Shell使用指南 (208)7.6 API使用 (214)7.7 HDFS的缺點 (216)7.8 HDFS存儲海量數據 (217)第8章 HBase存儲百科數據 (219)8.1 HBase的系統框架 (219)8.2 HBase基本特徵 (...
4.3.2 管理與更新 4.3.3 用戶命令 4.4 Hadoop輸入與輸出 4.4.1 MapReduce輸入與輸出 4.4.2 HDFS的輸入與輸出 4.5 分散式處理數據MapReduce 4.5.1 編程模型 4.5.2 MapReduce實現機制 4.5.3 MapReduce實例分析 4.6 分散式表HBase 4.6.1 數據模型 4.6.2 概念視圖 4.6.3 物理視圖 4.6.4...
圖418ApachePig官網123 圖419ApacheMahout官網124 圖420ApacheHBase官網125 圖421HBase與Hadoop項目125 圖422HBase邏輯模型126 圖423ApacheZookeeper官網127 圖424ApacheFlume官網127 圖425ApacheSqoop官網128 圖426Spark技術架構130 圖427Spark執行流程130 圖428SparkScheduler134 ...