《Hadoop大數據處理實戰》是2020年上海交通大學出版社出版的圖書。
基本介紹
- 中文名:Hadoop大數據處理實戰
- 作者:康開鋒,趙克寶,劉斌
- 出版社:上海交通大學出版社
- 出版時間:2020年
- ISBN:9787313224231
《Hadoop大數據處理實戰》是2020年上海交通大學出版社出版的圖書。
Hadoop大數據處理實戰 《Hadoop大數據處理實戰》是2020年上海交通大學出版社出版的圖書。
《大數據Hadoop 3.X分散式處理實戰》是2020年4月人民郵電出版社出版的圖書,作者是吳章勇、楊強。內容簡介 本書以實戰開發為原則,以Hadoop 3.X生態系統內的主要大數據工具整合套用及項目開發為主線,通過Hadoop大數據開發中常見的11個典型...
《Hadoop大數據實戰權威指南(第2版)》是2019年9月電子工業出版社出版的圖書,作者是黃東軍。 內容簡介 基於深入分析組件原理、充分展示搭建過程、詳細指導套用開發”的理念,以最新版Hadoop及其生態組件為對象,採用理論與套用高度融合的...
全書分為三篇,第一篇為大數據的基本概念和技術,主要介紹大數據的背景、發展及關鍵技術;第二篇為Hadoop大數據平台搭建與基本套用,內容涉及Linux、HDFS、MapReduce、YARN、Hive、HBase、Sqoop、Kafka、Spark等;第三篇為大數據處理與項目...
《Hadoop大數據分析實戰》是2019年5月1日清華大學出版社出版的圖書,作者是[美] 斯里達爾?奧拉。內容簡介 本書詳細闡述了與Hadoop 3大數據分析相關的基本解決方案,主要包括Hadoop簡介、大數據分析概述、基於MapReduce的大數據處理、Python-...
《Cloudera Hadoop大數據平台實戰指南》是清華大學出版社2019年出版的圖書,作者是宋立桓、陳建平。內容簡介 本書分為18章,系統介紹Hadoop 生態系統大數據相關的知識,包括大數據概述、Cloudera Hadoop平台的安裝部署、HDFS分散式檔案系統、Map...
《Hadoop 3.x大數據開發實戰(視頻教學版)》是清華大學出版社於2022年出版的書籍,作者是張偉洋 內容簡介 本書以Hadoop 3.x及其周框線架為主線,介紹了整個Hadoop生態系統主流的大數據開發技術。全書共16章,第1章講解VMware中CentOS 7...
《Hadoop大數據開發實戰》是2019年10月人民郵電出版社出版的圖書,作者是楊力。內容簡介 本書將大數據技術生態圈主流技術框架的套用與發展、搭建Hadoop大數據分散式系統集群平台、大數據分散式檔案系統HDFS(Hadoop Distributed File System)、...
使讀者熟悉Hadoop大數據開發兩大核心組件,即HDFS和MapReduce;第3~12章講解Hadoop生態系統各框架HDFS、MapReduce、輸入輸出、Hadoop集群配置、高可用集群、HBase、Hive、數據實時處理系統Flume,以及Spark框架數據處理、機器學習等實戰技術,並...
《Hadoop大數據開發實戰(慕課版)》是2022年人民郵電出版社出版的圖書,作者是千鋒教育高教產品研發部。 內容簡介 共分11章,第1章對大數據及Hadoop進行總體介紹,第2章講解了如何搭建Hadoop集群。第3-5章講解了HDFS分散式檔案系統、Map...
對於有條件的公司和學校,參照書中介紹的搭建過程,同樣可以將實踐平台搭建在多台實體計算機上,以便更加接近於大數據和機器學習真實的運行環境。《Hadoop+Spark大數據巨量分析與機器學習整合開發實戰》非常適合於學習大數據基礎知識的初學者閱讀...
13.2.3Hadoop集群大數據安全和隱私問題...252 13.3Hadoop平台硬體故障的應對機制...252 13.3.1監控軟硬體故障的應對機制...253 13.3.2斷電處理255 13.4Hadoop平台如何真正做到高可用性.255 13.4.1Hadoop系統的高可用性冗餘性保障...
本書圍繞Hadoop和Spark兩個主流大數據技術進行講解,主要內容包括Hadoop環境配置、Hadoop分散式檔案系統(HDFS)、Hadoop分散式計算框架MapReduce、Hadoop資源調度框架YARN與Hadoop新特性、Hadoop分散式資料庫HBase、數據倉庫Hive、大數據離線處理輔助...
Hadoop堪稱業界最經典的開源雲計算和大數據平台軟體。本書系統介紹了Hadoop 2.0生態圈的核心和擴展組件,包括:管理工具Ambari、分散式檔案系統HDFS、分散式資源管理器YARN、分散式並行處理MapReduce、記憶體型計算框架Spark、數據流實時處理系統...
對於有條件的公司和學校,參照書中介紹的搭建過程,同樣可以將實踐平台搭建在多台實體計算機上,以便更加接近於大數據和機器學習真實的運行環境。《Hadoop + Spark 大數據巨量分析與機器學習整合開發實戰》非常適合於學習大數據基礎知識的初學者...
數據挖掘基礎某知名連鎖餐飲企業的困惑從餐飲服務到數據挖掘數據挖掘的基本任務數據挖掘建模過程1.4.1 定義挖掘目標1.4.2 數據取樣1.4.3 數據探索1.4.4 數據預處理1.4.5 挖掘建模1.4.6 模型評價餐飲服務中的大數據套用小結...
《Hadoop硬實戰》是2015年1月電子工業出版社出版的圖書,作者是[美]AlexHolmes(亞歷克斯.霍姆斯)。內容簡介 Hadoop是一個開源的MapReduce平台,設計運行在大型分散式集群環境中,提供查詢和分析服務。尤其適用於大數據系統,Hadoop為蘋果、...
本書圍繞Hadoop和Spark這兩個主流技術進行講解,主要內容包括Hadoop環境配置、分散式檔案系統HDFS、分散式計算框架MapReduce、資源調度框架YARN與Hadoop新特性、大數據數據倉庫Hive、離線處理輔助系統、Spark Core、 Spark SQL、Spark Streaming等...
隨著大數據技術的發展和傳統技術的革新,醫療、交通、金融、電商等多個行業已經在使用大數據技術進行海量數據的處理,如疾病預防、出行規劃、股票預測、行為分析等。《Hadoop生態體系項目實戰》為用戶行為日誌分析的實現提供技術指導。《Hadoop...
Hadoop+Spark+Python大數據處理從算法到實戰 《Hadoop+Spark+Python大數據處理從算法到實戰》是2021年北京大學出版社出版的圖書。
《Hadoop + Spark生態系統操作與實戰指南》是2017年9月1日清華大學出版社出版的圖書,作者是餘輝。內容簡介 本書用於Hadoop+Spark快速上手,全面解析Hadoop和Spark生態系統,通過原理解說和實例操作每一個組件,讓讀者能夠輕鬆跨入大數據分析...