基本介紹
- 中文名:高可用性的HDFS:Hadoop分散式檔案系統深度實踐
- 出版社:清華大學出版社
- ISBN:9787302282587
- 定價:59 元
- 裝幀:平裝
- 印次:1-1
- 印刷日期:2012-4-28
Hadoop分散式檔案系統(HDFS)是指被設計成適合運行在通用硬體(commodity hardware)上的分散式檔案系統(Distributed File System)。它和現有的分散式檔案系統有很多共同點。但同時,它和其他的分散式檔案系統的區別也是很明顯的。HDFS是一個高度...
本書全面介紹了大數據技術生態圈,更在此基礎上全景展現了Hadoop大數據分散式系統集群平台的搭建、大數據分散式檔案系統HDFS、大數據分散式並行計算框架MapReduce、Hadoop大數據倉庫工具Hive和海量日誌採集工具Flume等大數據實用技術。本書通俗易懂、...
對於數據處理來說,使用Hadoop是一個全新的挑戰,但如果有了這本便利的參考書,你將很容易領會使用Hadoop的精妙所在。 主要包括如下主題:核心技術,Hadoop分散式檔案系統(HDFS)、MapReduce、YARN和Spark。資料庫和數據管理,Cassandra、H...
《Hadoop生態體系項目實戰》是2019年天津大學出版社出版的圖書,作者是天津濱海迅騰科技集團有限公司。全書主要涉及八個項目,即Hadoop介紹、分散式檔案系統(HDFS)、強大的計算框架(Map Reduce)、數據倉庫工具(Hive)等內容。內容簡介 大數...
全書共11章,其中,第1、2章主要帶領大家認識Hadoop以及學會搭建Hadoop集群;第3~5章講解分散式檔案系統(HDFS)、分散式計算框架MapReduce以及分散式協調服務;第6章講解Hadoop 2.0新特性,包含YARN和高可用特性;第7~10章主要講解Hadoop...
《Hadoop大數據技術與套用》是2019年12月人民郵電出版社出版的圖書,作者是楊治明、許桂秋。內容簡介 本書採用理論與實踐相結合的方式,全面介紹了Hadoop大數據技術。主要內容包括初識Hadoop大數據技術、Hadoop環境配置,分散式檔案系統HDFS、資源...
第3章 Hadoop分散式檔案系統——HDFS 32 3.1 HDFS原理 32 3.1.1 HDFS的假設前提和設計目標 32 3.1.2 HDFS的組件 33 3.1.3 HDFS數據複製 36 3.1.4 HDFS健壯性 36 3.1.5 HDFS數據組織 38 3.2 HDFS Shell...
本書系統介紹了Hadoop生態系統的核心開發技術,包括:Hadoop大數據技術概述、Hadoop開發及運行環境搭建、HDFS分散式檔案系統、MapReduce分散式計算技術框架、Hadoop的檔案I/O以及YARN資源管理器、Zookeeper分散式協調服務、Hadoop分散式集群搭建與管理...
2.3 Linux系統配置 23 2.4 Hadoop的配置部署 39 本章總結 47 本章習題 47 第3章 HDFS入門 48 3.1 Hadoop分散式檔案系統HDFS 48 3.1.1 認識HDFS 48 3.1.2 HDFS的優勢 49 3.1.3 HDFS局限性 50 3.1.4 ...
書是劉鵬教授主編的國內第一本Hadoop編程書籍《實戰Hadoop》的第二版。Hadoop堪稱業界最經典的開源雲計算和大數據平台軟體。本書系統介紹了Hadoop 2.0生態圈的核心和擴展組件,包括:管理工具Ambari、分散式檔案系統HDFS、分散式資源管理器YARN...
2.2 操作分散式檔案系統(HDFS).. 39 2.2.1 基本的套用接口操作.. 39 2.2.2 在高可用平台上的使用方法.. 42 2.3 利用IDE提交MapReduce作業.. 43 2.3.1 在單點上的操作.. 43 2.3.2 在高可用平台上的操作....
1.3.2 安裝Linux作業系統 13 1.3.3 搭建移動通信業務的Hadoop處理平台 25 1.3.4 大數據集群管理平台 28 1.3.5 技能實訓 29 本章總結 29 本章作業 29 第 2章 Hadoop分散式檔案系統HDFS 31 任務1 了解HDFS 32 2...
第1篇Hadoop基礎知識,涵蓋大數據概述、Hadoop的安裝與配置、Hadoop分散式檔案系統及基於Hadoop 3的HDFS高可用等相關內容;第2篇Hadoop核心技術,涵蓋的內容有Hadoop的分散式協調服務——ZooKeeper;分散式離線計算框架——MapReduce;Hadoop的集群...
2.2 操作分散式檔案系統(HDFS)39 2.2.1 基本的套用接口操作39 2.2.2 在高可用平台上的使用方法42 2.3 利用IDE提交MapReduce作業43 2.3.1 在單點上的操作43 2.3.2 在高可用平台上的操作46 2.4 編譯...
《Hadoop集群程式設計與開發》是2019年8月人民郵電出版社出版的圖書,作者是王宏志、李春靜。內容簡介 本書主要內容包括:第 1章 初識Hadoop、第 2章 Hadoop基礎、第3章 Hadoop開發環境配置與搭建、第4章 Hadoop分散式檔案系統(HDFS)、...
2.4.3Hadoop集群角色分配 21 2.4.4網路拓撲 23 第3章ClouderaManager及CDH離線安裝部署 25 3.1安裝前的準備工作 25 3.2ClouderaManager及CDH安裝 30 3.3添加其他大數據組件 35 第4章分散式檔案系統HDFS 37 4.1HDFS簡介 37 4....
1.2 Hadoop簡介 1.3 Hadoop HDFS分散式檔案系統 1.4 Hadoop MapReduce的介紹 1.5 Spark的介紹 1.6 機器學習的介紹 第2章 VirtualBox虛擬機軟體的安裝 2.1 VirtualBox的下載和安裝 2.2 設定VirtualBox語言版本 2.3 設定...
使用Hadoop分析數據 18 map階段和reduce階段 18 橫向擴展 27 合併函式 30 運行一個分散式的MapReduce作業 33 Hadoop的Streaming 33 Ruby版本 33 Python版本 36 Hadoop Pipes 37 編譯運行 38 第3章 Hadoop分散式檔案系統 41 HDFS的設計...
北京線上九州信息技術服務有限公司、華北計算技術研究所、北京優貝線上網路科技有限公司,擔任DBA、數據架構師等職位。著有圖書《Hadoop構建數據倉庫實踐》《HAWQ數據倉庫與數據挖掘實戰》《SQL機器學習庫MADlib技術解析》《MySQL高可用實踐》。
Hadoop 數據安全 27 總結 28 第2章 Hadoop架構介紹 31 Hadoop與分散式計算 31 Hadoop 架構 32 Hadoop 集群 33 主節點和工作節點 33 Hadoop 服務 34 數據存儲—Hadoop分散式檔案系統 35 HDFS 特性 35 HDFS 架構 36 HDFS 檔案系統 38...
Hadoop和Spark正是在這種背景下產生的兩個大數據開源平台。《Hadoop/Spark大數據機器學習》重點介紹基於這兩種大數據開源平台的機器學習,包括機器學習概述、大數據與大數據處理系統、Hadoop分散式檔案系統HDFS、Hadoop並行編程框架MapReduce、Hadoop...