《Hadoop MapReduce實戰手冊》是人民郵電出版社出版的書籍,作者是[斯里蘭卡] Srinath Perera,ThilinaGunarathne。
基本介紹
- 書名:Hadoop MapReduce實戰手冊
- 作者:[斯里蘭卡] Srinath Perera,Thilina Gunarathne
- 譯者:楊海玲
- 出版社:人民郵電出版社
- 定價:49 元
- ISBN:978-7-115-38437-9
《Hadoop MapReduce實戰手冊》是人民郵電出版社出版的書籍,作者是[斯里蘭卡] Srinath Perera,ThilinaGunarathne。
《Hadoop實戰手冊》是2017年8月人民郵電出版社出版的圖書,作者是[美]Jonathan R·Owens、Jon Lentz、Brian Femiano。內容簡介 這是一本Hadoop實用手冊,主要針對實際問題給出相應的解決方案。《Hadoop實戰手冊》特色是以實踐結合理論分析,...
4.4.7 配置MapReduce計算框架檔案 109 4.4.8 配置Master中的workers檔案 111 4.4.9 將Master上的Hadoop複製到Slave 111 4.5 Hadoop集群的啟動 112 4.5.1 配置作業系統的環境變數 112 4.5.2 創建Hadoop數據...
MapReduce的簡介 4.2 MapReduce的源碼分析 4.3 MapReduce on YARN 4.4 Application on YARN 4.5 小結 第 5 章 實戰指南 5.1 Hadoop 3.x的部署 5.2 Hadoop升級 5.3 二次開發 5.4 周邊系統平台 5.5 小結 ...
2.4Apache版本Hadoop集群搭建36 2.5CDH版本Hadoop集群搭建44 2.5.1安裝前期準備44 2.5.2ClouderaManager安裝45 2.5.3CDH安裝46 2.6小結55 第3章Hadoop基礎與原理56 3.1MapReduce原理介紹56 3.1.1MapReduce的框架介紹56 3.1....
1.1 為什麼寫《Hadoop 實戰》 3 1.2 什麼是Hadoop 3 1.3 了解分散式系統和Hadoop 4 1.4 比較SQL資料庫和Hadoop 5 1.5 理解MapReduce 6 1.5.1 動手擴展一個簡單程式 7 1.5.2 相同程式在MapReduce中的擴展 9 ...
本書內容全面,對hadoop整個技術體系進行了全面的講解,不僅包括hdfs、mapreduce、yarn等核心內容,而且還包括hive、hbase、mahout、pig、zookeeper、avro、chukwa等與hadoop技術相關的重要內容。實戰性強,不僅為各個知識點精心設計了大量經典...
作為谷歌雲計算技術的開源實現,Hadoop是最受關注的雲計算技術平台。該書強調動手、強調實戰,以風趣幽默的語言和一系列生動的套用實例,系統地講授了Hadoop的核心技術和擴展技術,包括:MapReduce、HDFS、HBase、Hive、Pig、Cassandra、Chukwa...
全書分為三篇,第一篇為大數據的基本概念和技術,主要介紹大數據的背景、發展及關鍵技術;第二篇為Hadoop大數據平台搭建與基本套用,內容涉及Linux、HDFS、MapReduce、YARN、Hive、HBase、Sqoop、Kafka、Spark等;第三篇為大數據處理與項目...
《Hadoop海量數據處理:技術詳解與項目實戰》介紹了Hadoop技術的相關知識,並將理論知識與實際項目相結合。全書共分為三個部分:基礎篇、套用篇和總結篇。基礎篇詳細介紹了Hadoop、MapReduce、HDFS、Hive和Sqoop,並深入探討了Hadoop的運維和...
第2章Hadoop的前世今生...25 2.1Google的計算框架...26 2.1.1Google公司的三篇論文...26 2.1.2GFS檔案系統...27 2.1.3MapReduce的模型和框架...28 2.1.4BigTable資料庫..29 2.2Hadoop的誕生...30 2.2.1從GFS到...
本書分為18章,系統介紹Hadoop 生態系統大數據相關的知識,包括大數據概述、Cloudera Hadoop平台的安裝部署、HDFS分散式檔案系統、MapReduce計算框架、資源管理調度框架YARN 、Hive數據倉庫、數據遷移工具Sqoop、分散式資料庫HBase、ZooKeeper分散式...
全書共16章,第1章講解了VMware中CentOS 7作業系統的安裝;第2章講解了大數據開發之前對作業系統集群環境的配置;第3~16章講解了Hadoop生態系統各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和數據實時處理系統Flume、Kafka、...
資深雲計算技術講師潛心力作CSDNHadoop版主鼎力推薦 深入淺出、結合實例,幫你在實戰中掌握MapReduce2.0編程的精髓 作者簡介 王曉華,高校資深計算機專業講師,給研究生和本科生講授面向對象程式設計、數據結構、Hadoop程式設計等相關課程。主...
本書從Hadoop的緣起開始,由淺入深,結合理論和實踐,全方位地介紹Hadoop這一高性能處理海量數據集的理想工具。全書共16章,3個附錄,涉及的主題包括:Haddoop簡介;MapReduce簡介;Hadoop分散式檔案系統;Hadoop的I/O、MapReduce應用程式...
7.1.3 MapReduce的設計目標 130 7.2 WordCount編程實例 130 7.2.1 案例需求 130 7.2.2 搭建開發環境Eclipse 131 7.2.3 代碼實現 132 7.2.4 代碼測試 135 7.2.5 案例剖析 139 7.3 Hadoop MapReduce架構 ...
4.6.4Hadoop 2.X中HDFS的高可用性實現原理100 4.6.5Federation機制101 4.7HDFS中小檔案存儲問題105 4.7.1檔案歸檔技術105 4.7.2SequenceFile格式108 4.7.3CombineFileInputFormat108 第5章MapReduce原理及開發110 5.1初識Map...
《Hadoop海量數據處理:技術詳解與項目實戰》介紹了Hadoop技術的相關知識,並將理論知識與實際項目相結合。全書共分為三個部分:基礎篇、套用篇和總結篇。基礎篇詳細介紹了Hadoop、MapReduce、HDFS、Hive和Sqoop,並深入探討了Hadoop的運維和...
內容包括Hadoop概述與大數據環境準備、Hadoop偽分散式集群搭建、HDFS分散式存儲實戰、MapReduce實戰、ZooKeeper與高可用集群實戰、Hive數據倉庫實戰、HBase資料庫實戰、Flume數據採集實戰、Kafka實戰、影評大數據分析項目實戰、旅遊酒店評價大數據分析...
5.1.4利用RMR2在MapReduce內執行R137 5.2R語言和Hadoop間的集成方法138 5.2.1RHadoop—在工作站上安裝R並將數據連線至Hadoop中139 5.2.2RHIPE—在HadoopMapReduce中執行R語言139 5.2.3R和Hadoop流139 5.2.4RHIVE—在工作站...
Hadoop堪稱業界最經典的開源雲計算和大數據平台軟體。本書系統介紹了Hadoop 2.0生態圈的核心和擴展組件,包括:管理工具Ambari、分散式檔案系統HDFS、分散式資源管理器YARN、分散式並行處理MapReduce、記憶體型計算框架Spark、數據流實時處理系統...
4.4.2 啟動Hadoop進程 111 4.4.3 客戶端向HDFS寫檔案 112 4.4.4 客戶端向HDFS讀檔案 114 習題 115 項目5 MapReduce分散式編程 117 任務1 認識MapReduce 117 5.1.1 MapReduce介紹 117 5.1.2 Wordcount程式...
本書以實戰開發為原則,以Hadoop 3.X生態系統內的主要大數據工具整合套用及項目開發為主線,通過Hadoop大數據開發中常見的11個典型模組和3個完整項目案例,詳細介紹HDFS、MapReduce、HBase、Hive、Sqoop、Spark等主流大數據工具的整合使用。本...
5.6 新增Hadoop API 136 5.7 Hadoop的Streaming 138 5.7.1 通過UNIX命令使用Streaming 138 5.7.2 通過Ruby版本使用Streaming 139 5.7.3 通過Python版本使用Streaming 141 5.8 MapReduce實戰 142 5.8.1 MapReduce排序 142 5.8...
全書共有12章,從Hadoop概述開始,介紹了Hadoop的安裝與配置管理,並對Hadoop的生態體系架構進行了介紹,包括HDFS技術、YARN技術、MapReduce技術、Hadoop I/O操作、海量資料庫技術HBase、ZooKeeper技術、分散式數據倉庫技術Hive、分散式數據分析...
本書以Hadoop 3.x及其周框線架為主線,介紹了整個Hadoop生態系統主流的大數據開發技術。全書共16章,第1章講解VMware中CentOS 7作業系統的安裝;第2章講解作業系統集群環境的配置;第3~16章講解Hadoop生態系統各框架HDFS、MapReduce、YARN...
共分11章,第1章對大數據及Hadoop進行總體介紹,第2章講解了如何搭建Hadoop集群。第3-5章講解了HDFS分散式檔案系統、MapReduce分散式計算框架以及Zookeeper分散式協調服務。第6章講解Hadoop2.0的新特性。第7-10章主要講解了Hadoop生態圈中...