讀者對象
雲計算研發人員,包括院校、科研機構師生和科研人員,各類雲計算技術企業和套用企業研發人員
圖書目錄
第1章 神奇的大象——Hadoop
1.1 初識神象 1.2 Hadoop初體驗 1.3 Hadoop世界的風俗
第2章 分久必合——MapReduce
2.1 MapReduce基礎
2.2 一切從“Hello World”開始——文字計數
2.3 MapReduce,你夠了解嗎?
2.5 實戰:倒排索引
2.4 實戰:用MapReduce進行海量數據排序
第3章 HDFS:不怕故障的海量存儲
3.1 開源的GFS——HDFS 3.3 HDFS API之旅 3.4 檔案操作示例
3.5 實戰:用HDFS存儲海量視頻數據
第4章 HBase:一張無限大的表
4.1 HBase數據模型
4.2 HBase的入門儀式
4.3 HBase操作演練
4.4 HBase查詢語言HBQL
4.4 實戰:用HBase管理通話記錄數據
第5章 MapReduce進階
5.1複合鍵值對的使用
5.1.1用複合鍵讓系統完成排序
5.1.2把小的鍵值對合併成大的鍵值對
5.2用戶定製數據類型
5.2.1 Hadoop內置的數據類型
5.2.2用戶自定義數據類型的實現
5.3用戶定製輸入輸出格式
5.3.1 Hadoop內置的檔案輸入格式和RecordReader
5.3.2用戶自定義InputFormat和RecordReader示例
5.3.3 Hadoop內置的檔案輸出格式和RecordWriter
5.3.4用戶自定義OutputFormat和RecordWriter示例
5.4用戶定製Partitioner和Combiner
5.4.1用戶定製Partitioner
5.4.2用戶定製Combiner
5.5疊代完成MapReduce計算
5.5.1基本問題
5.5.2疊代MapReduce計算任務示例
5.6複合MapReduce計算過程的實現
5.6.1順序化MapReduce任務的執行
5.6.2具有數據依賴關係的MapReduce任務的執行
5.6.3 MapReduce前處理和後處理步驟的鏈式執行
5.7多數據源的連線
5.7.1基本問題
5.7.2用DataJoin類實現Reduce端Join
5.7.3用檔案複製方法實現Map端Join
5.7.4帶Map端過濾的Reduce端Join
5.7.5多數據源連線解決方法的限制
5.8全局參數/數據檔案的傳遞
5.8.1全局作業參數的傳遞
5.8.2全局數據檔案的傳遞
5.9 關係資料庫的連線與訪問
5.9.1從資料庫中輸入數據
5.9.2向資料庫中輸出計算結果
5.10其它處理技術
5.10.1查詢任務相關信息
5.10.2劃分多個輸出檔案集合
第6章 Hive:飛進數據倉庫的小蜜蜂
6.1 搭建蜂房——Hive安裝
6.2 Hive的服務
6.3 HiveQL的使用
6.4 Hive示例
6.5 實戰:?
第7章 Pig:一頭什麼都能吃的豬
7.1 Pig的安裝
7.2 Pig Shell的使用
7.3 Pig Latin程式語言
7.4 Pig示例
7.5 實戰:?
第8章 Cassandra:來自Facebook的女神
8.1 讓Canssandra飛起來
8.2 洞察Cassandra的全貌
8.3 Cassandra與Hadoop聯姻
8.4 Cassandra操作示例
8.5 實戰:?
第9章 Chukwa:收集數據的大烏龜
9.1 Chukwa安裝與配置
9.2 Chukwa的設計
9.3 Chukwa實踐之路
9.4 實戰:?
第10章 動物管理員ZooKeeper
10.1 誰動了ZK的鑰匙
10.2 ZK是個謎
10.3 何去何從的ZK
10.4 ZooKeeper演練
10.5 實戰:?
第11章 綜合實戰:打造一個搜尋引擎
第12章 綜合實戰:生物信息學套用
第13章 綜合實戰:行動網路信令監測
第14章 高枕無憂:Hadoop容錯