《實戰Hadoop大數據處理》是2015年8月清華大學出版社出版的圖書,作者是曾剛。
基本介紹
- 書名:實戰Hadoop大數據處理
- 作者:曾剛
- ISBN:9787302411444
- 定價:39元
- 出版社:清華大學出版社
- 出版時間:2015年8月
《實戰Hadoop大數據處理》是2015年8月清華大學出版社出版的圖書,作者是曾剛。
《實戰Hadoop大數據處理》是2015年8月清華大學出版社出版的圖書,作者是曾剛。內容簡介 本書以“大數據”為起點,較詳細地介紹了Hadoop的相關知識。全書共分為9章,介紹了大數據的基本理論、Hadoop生態系統、Hadoop的安裝、HDFS分散式檔案...
Hadoop大數據分析實戰內容簡介 編輯 本書詳細闡述了與Hadoop 3大數據分析相關的基本解決方案,主要包括Hadoop簡介、大數據分析概述、基於MapReduce的大數據處理、Python-Hadoop科學計算和大數據分析、R-Hadoop統計數據計算、Apache Spark批處理...
《大數據Hadoop 3.X分散式處理實戰》是2020年4月人民郵電出版社出版的圖書,作者是吳章勇、楊強。內容簡介 本書以實戰開發為原則,以Hadoop 3.X生態系統內的主要大數據工具整合套用及項目開發為主線,通過Hadoop大數據開發中常見的11個...
《Hadoop海量數據處理:技術詳解與項目實戰》介紹了Hadoop技術的相關知識,並將理論知識與實際項目相結合。全書共分為三個部分:基礎篇、套用篇和總結篇。基礎篇詳細介紹了Hadoop、MapReduce、HDFS、Hive和Sqoop,並深入探討了Hadoop的運維和...
《Hadoop海量數據處理技術詳解與項目實戰(第2版)》是2015年人民郵電出版社出版的圖書,作者是范東來。基本簡介 本書介紹了Hadoop技術的相關知識,並將理論知識與實際項目相結合。全書共分為三個部分:基礎篇、套用篇和總結篇。基礎篇...
《Hadoop大數據實戰權威指南》是2017年電子工業出版社出版的圖書,作者是黃東軍。內容簡介 大數據貴在落實! 本書是一本講解大數據實戰的圖書,按照“深入分析組件原理、充分展示搭建過程、詳細指導套用開發”編寫。全書分為三篇,第一篇為...
本書將大數據技術生態圈主流技術框架的套用與發展、搭建Hadoop大數據分散式系統集群平台、大數據分散式檔案系統HDFS(Hadoop Distributed File System)、大數據分散式並行計算框架MapReduce、大數據汽車銷售數據統計分析項目5大模組分為11章內容...
6.1.6 Amazon EMR的實戰運用 170 6.2 總結 178 第7章 Hadoop套用下的大數據分析 179 7.1 Hadoop套用下的機器學習(Mahout) 180 7.1.1 設定及編譯 181 7.1.2 K-means 聚類算法 183 7.1.3 基於矢量相似度的協同過濾 ...
全書共16章,第1章講解了VMware中CentOS 7作業系統的安裝;第2章講解了大數據開發之前對作業系統集群環境的配置;第3~16章講解了Hadoop生態系統各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和數據實時處理系統Flume、Kafka...
《Hadoop大數據實戰權威指南(第2版)》是2019年9月電子工業出版社出版的圖書,作者是黃東軍。 內容簡介 基於深入分析組件原理、充分展示搭建過程、詳細指導套用開發”的理念,以最新版Hadoop及其生態組件為對象,採用理論與套用高度融合...
第3篇Hadoop項目案例實戰,主要介紹了基於電商產品的大數據業務分析系統、用戶畫像分析、基於個性化的視頻推薦系統及電信離網用戶挽留4個項目實戰案例,以提高讀者的大數據項目開發水平。本書內容全面,實用性強,適合作為Hadoop大數據分析與...
7.2.2 查看Hadoop JIRA. 212 7.2.3 閱讀相關源碼.. 213 7.3 實戰案例分析.. 216 7.3.1 案例分析1:啟動HBase失敗.. 216 7.3.2 案例分析2:HBase表查詢失敗.. 219 7.3.3 案例分析3:Spark的臨時數據不自動...
《Hadoop & Spark大數據開發實戰》是2017年中國水利水電出版社出版的圖書,作者是肖睿、雷剛躍、宋麗萍、張宇、彭英。內容簡介 大數據讓我們以一種前所未有的方式,通過對海量數據進行分析,獲得有巨大價值的產品和服務,*終形成變革之力...
|第10章| 數據流實時處理系統Storm 399 10.1 Storm簡介 400 10.1.1 與Hadoop的關係 400 10.1.2 基礎概念 402 10.1.3 體系架構 408 10.1.4 集群部署[4] 412 10.1.5 計算模型 421 10.2 Storm接口 450 10.3 實戰...
對於有條件的公司和學校,參照書中介紹的搭建過程,同樣可以將實踐平台搭建在多台實體計算機上,以便更加接近於大數據和機器學習真實的運行環境。《Hadoop+Spark大數據巨量分析與機器學習整合開發實戰》非常適合於學習大數據基礎知識的初學者...
《Hadoop海量數據處理:技術詳解與項目實戰》是2016年1月人民郵電出版社出版的圖書,作者是范東來。內容簡介 《Hadoop海量數據處理:技術詳解與項目實戰》介紹了Hadoop技術的相關知識,並將理論知識與實際項目相結合。全書共分為三個部分:...
—特徵提取;Hadoop平台管理與維護;Hadoop異常處理解決方案;初識Hadoop核心源碼;Hadoop通信機制和內部協定;Hadoop分散式檔案系統剖析;ELK實戰案例——遊戲套用實時日誌分析平台;Kafka實戰案例——實時處理遊戲用戶數據;Hadoop拓展——Kafka...
生態系統大數據相關的知識,包括大數據概述、Cloudera Hadoop平台的安裝部署、HDFS分散式檔案系統、MapReduce計算框架、資源管理調度框架YARN 、Hive數據倉庫、數據遷移工具Sqoop、分散式資料庫HBase、ZooKeeper分散式協調服務、準實時分析系統Impala...
《Hadoop+Spark大數據巨量分析與機器學習整合開發實戰》是2017年清華大學出版社出版的圖書,作者是林大貴。內容簡介 《Hadoop + Spark 大數據巨量分析與機器學習整合開發實戰》從淺顯易懂的“大數據和機器學習”原理介紹和說明入手,講述大...
7.2.2 查看Hadoop JIRA212 7.2.3 閱讀相關源碼213 7.3 實戰案例分析216 7.3.1 案例分析1:啟動HBase失敗216 7.3.2 案例分析2:HBase表查詢失敗219 7.3.3 案例分析3:Spark的臨時數據不自動清理222 7....
第1章 Hadoop概述 1 1.1 商業分析與大數據 2 1.1.1 Hadoop的組件 3 1.1.2 Hadoop分散式檔案系統(HDFS) 3 1.1.3 MapReduce是什麼 4 1.1.4 YARN是什麼 5 1.2 ZooKeeper是什麼 6 1.3 Hive是什麼 7 1.4 與其他系統...
Zookeeper分散式協調服務、Hadoop分散式集群搭建與管理、Hive 數據倉庫和HBase分散式資料庫、Hadoop生系系統常用開發技術,並通過廣電收視率數據統計分析和視頻網站爬蟲系統開發兩個實踐項目,詳細直觀地介紹了大數據項目的開發思路及流程。
全書分為“基礎實驗篇”和“拓展實驗篇”兩篇,共10章,涉及數據採集、數據存儲與管理、數據處理與分析等大數據套用生命周期中各階段典型組件的部署、使用和基礎編程方法。“基礎實驗篇”內容包括部署全分布模式Hadoop集群、實戰HDFS、Map...
《Hadoop大數據平台構建與套用》是2020年3月電子工業出版社出版的圖書,作者是王傳東、盧澔、馬榮飛。內容簡介 本書基於Hadoop大數據平台,講解大數據平台的搭建與運維、大數據的採集與存儲、大數據的處理、數據的分析、數據的可視化等完整...
《Hadoop大數據技術原理與套用》是2019年5月清華大學出版社出版的圖書,作者是黑馬程式設計師。內容簡介 本書圍繞Hadoop生態圈相關係統介紹大數據處理架構。全書共11章,其中,第1、2章主要帶領大家認識Hadoop以及學會搭建Hadoop集群;第3~5章...
《Hadoop大數據處理》共10章,涉及的主題包括大數據處理概論、基於Hadoop的大數據處理框架、MapReduce計算模式、使用HDFS存儲大數據、HBase大資料庫、大數據的分析處理、Hadoop環境下的數據整合、Hadoop集群的管理與維護、基於MapReduce的數據挖...