《Hadoop技術內幕:深入解析MapReduce架構設計與實現原理》是董西成編著的圖書,由機械工業出版社出版。
基本介紹
- 書名:Hadoop技術內幕:深入解析MapReduce架構設計與實現原理
- 作者:董西成
- 出版社:機械工業出版社
- 出版時間:2013年5月
- ISBN:9787111422266
內容簡介,作品目錄,
“Hadoop技術內幕”共兩冊,分別從原始碼的角度對“Common+HDFS”和“MapReduce的架構設計和實現原理”進行了極為詳細的分析。《Hadoop技術內幕:深入解析MapReduce架構設計與實現原理》由Hadoop領域資深的實踐者親自執筆,首先介紹了MapReduce的設計理念和編程模型,然後從原始碼的角度深入分析了RPC框架、客戶端、JobTracker、TaskTracker和Task等MapReduce運行時環境的架構設計與實現原理,最後從實際套用的角度深入講解了Hadoop的性能最佳化、安全機制、多用戶作業調度器和下一代MapReduce框架等高級主題和內容。
本書適合Hadoop的二次開發人員、套用開發工程師、運維工程師閱讀。
- 前言
- 為什麼要寫這本書
- 讀者對象
- 如何閱讀本書
- 勘誤和支持
- 致謝
- 第一部分 基礎篇
- 第1章 閱讀原始碼前的準備
- 1.1 準備原始碼學習環境
- 1.2 獲取Hadoop原始碼
- 1.3 搭建Hadoop原始碼閱讀環境
- 1.4 Hadoop原始碼組織結構
- 1.5 Hadoop初體驗
- 1.6 編譯及調試Hadoop原始碼
- 1.7 小結
- 第2章 MapReduce設計理念與基本架構
- 2.1 Hadoop發展史
- 2.2 Hadoop MapReduce設計目標
- 2.3 MapReduce編程模型概述
- 2.4 Hadoop基本架構
- 2.5 Hadoop MapReduce作業的生命周期
- 2.6 小結
- 第二部分 MapReduce編程模型篇
- 第3章 MapReduce編程模型
- 3.1 MapReduce編程模型概述
- 3.2 MapReduce API基本概念
- 3.3 Java API解析
- 3.4 非Java API解析
- 3.5 Hadoop工作流
- 3.6 小結
- 第三部分 MapReduce核心設計篇
- 第4章 Hadoop RPC框架解析
- 4.1 Hadoop RPC框架概述
- 4.2 Java基礎知識
- 4.3 Hadoop RPC基本框架分析
- 4.4 MapReduce通信協定分析
- 4.5 小結
- 第5章 作業提交與初始化過程分析
- 5.1 作業提交與初始化概述
- 5.2 作業提交過程詳解
- 5.3 作業初始化過程詳解
- 5.4 Hadoop DistributedCache原理分析
- 5.5 小結
- 第6章 JobTracker內部實現剖析
- 6.1 JobTracker概述
- 6.2 JobTracker啟動過程分析
- 6.3 心跳接收與應答
- 6.4 Job和Task運行時信息維護
- 6.5 容錯機制
- 6.6 任務推測執行原理
- 6.7 Hadoop資源管理
- 6.8 小結
- 第7章 TaskTracker內部實現剖析
- 7.1 TaskTracker概述
- 7.2 TaskTracker啟動過程分析
- 7.3 心跳機制
- 7.4 TaskTracker行為分析
- 7.5 作業目錄管理
- 7.6 啟動新任務
- 7.7 小結
- 第8章 Task運行過程分析
- 8.1 Task運行過程概述
- 8.2 基本數據結構和算法
- 8.3 Map Task內部實現
- 8.4 Reduce Task內部實現
- 8.5 Map/Reduce Task最佳化
- 8.6 小結
- 第四部分 MapReduce高級篇
- 第9章 Hadoop性能調優
- 9.1 概述
- 9.2 從管理員角度進行調優
- 9.3 從用戶角度進行調優
- 9.4 小結
- 第10章 Hadoop多用戶作業調度器
- 10.1 多用戶調度器產生背景
- 10.2 HOD
- 10.3 Hadoop佇列管理機制
- 10.4 Capacity Scheduler實現
- 10.5 Fair Scheduler實現
- 10.6 其他Hadoop調度器介紹
- 10.7 小結
- 第11章 Hadoop安全機制
- 11.1 Hadoop安全機制概述
- 11.2 基礎知識
- 11.3 Hadoop安全機制實現
- 11.4 套用場景總結
- 11.5 小結
- 第12章 下一代MapReduce框架
- 12.1 第一代MapReduce框架的局限性
- 12.2 下一代MapReduce框架概述
- 12.3 Apache YARN
- 12.4 Facebook Corona
- 12.5 Apache Mesos
- 12.6 小結
- 附錄A 安裝Hadoop過程中可能存在的問題及解決方案
- 附錄B Hadoop默認HTTP連線埠號以及HTTP地址
- 參考資料