高可用性的HDFS:Hadoop分散式檔案系統深度實踐

基本信息

印次：1-1

印刷日期：2012-4-28

本書從代碼入手並結合情景分析、案例解說對HDFS的元數據以及主流的HDFSHA解決方案的運行機制進行了深入剖析，力求使讀者在解決問題時做到心中有數，不僅知其然還知其所以然。

本書可操作性強，所有案例都經過驗證並附有詳細的步驟說明和視頻教程，無論是對雲計算的初學者，還是想進一步深入學習雲計算技術的研發人員，或是雲計算的研究人員都有很好的參考價值。

本書光碟包含本書部分操作的視頻教程以及所有原始碼、腳本等開發檔案。

本書讀者主要為雲計算相關領域的研發人員、雲計算系統管理維護人員，也適合作為高校研究生和高年級本科生的專業課輔助教材。

第1章HDFSHA及解決方案 1

1.1HDFS系統架構 2

1.2HA定義 3

1.3HDFSHA原因分析及應對措施 4

1.3.1可靠性 4

1.3.2可維護性 5

1.4現有HDFSHA解決方案 5

1.4.1Hadoop的元數據備份方案 6

1.4.2Hadoop的SecondaryNameNode方案 7

1.4.3Hadoop的Checkpointode方案 7

1.4.4Hadoop的BackupNode方案 8

1.4.5DRDB方案 9

1.4.6FaceBook的AvatarNode方案 10

1.5方案優缺點比較 10

第2章HDFS元數據解析 13

2.1概述 14

2.2記憶體元數據結構 14

2.2.1INode 15

2.2.2Block 16

2.2.3BlockInfo和DatanodeDescriptor 17

2.2.4小結 17

2.2.5代碼分析——元數據結構 18

2.3磁碟元數據檔案 24

2.4Format情景分析 27

2.5元數據套用場景分析 45

第3章Hadoop的元數據備份方案 47

3.1運行機制分析 48

3.1.1NameNode啟動載入元數據情景分析 50

3.1.2元數據更新及日誌寫入情景分析 64

3.1.3Checkpoint過程情景分析 73

3.1.4元數據可靠性機制 109

3.1.5元數據一致性機制 110