《實戰Hadoop大數據處理》是2015年8月清華大學出版社出版的圖書,作者是曾剛。
基本介紹
- 中文名:實戰Hadoop大數據處理
- 作者:曾剛
- 出版社:清華大學出版社
- 出版時間:2015年8月
- 定價:39 元
- ISBN:9787302411444
《實戰Hadoop大數據處理》是2015年8月清華大學出版社出版的圖書,作者是曾剛。
《Hadoop大數據實戰權威指南(第2版)》是2019年9月電子工業出版社出版的圖書,作者是黃東軍。 內容簡介 基於深入分析組件原理、充分展示搭建過程、詳細指導套用開發”的理念,以最新版Hadoop及其生態組件為對象,採用理論與套用高度融合的...
《大數據Hadoop 3.X分散式處理實戰》是2020年4月人民郵電出版社出版的圖書,作者是吳章勇、楊強。內容簡介 本書以實戰開發為原則,以Hadoop 3.X生態系統內的主要大數據工具整合套用及項目開發為主線,通過Hadoop大數據開發中常見的11個典型...
Hadoop大數據處理實戰 《Hadoop大數據處理實戰》是2020年上海交通大學出版社出版的圖書。
1.1.5 Hadoop和雲計算 8 1.2 Hadoop和大數據 9 1.2.1 大數據的定義 9 1.2.2 大數據的結構類型 11 1.2.3 大數據行業套用實例 12 1.2.4 Hadoop和大數據 13 1.2.5 其他大數據處理平台 15 1.3 數據挖掘和...
《實戰Hadoop 2.0(第二版)——從雲計算到大數據》是2016年電子工業出版社出版的一本圖書,作者是葉曉江、劉鵬。內容簡介 書是劉鵬教授主編的國內第一本Hadoop編程書籍《實戰Hadoop》的第二版。Hadoop堪稱業界最經典的開源雲計算和大數據...
全書分為三篇,第一篇為大數據的基本概念和技術,主要介紹大數據的背景、發展及關鍵技術;第二篇為Hadoop大數據平台搭建與基本套用,內容涉及Linux、HDFS、MapReduce、YARN、Hive、HBase、Sqoop、Kafka、Spark等;第三篇為大數據處理與項目...
《Hadoop大數據分析實戰》是2019年5月1日清華大學出版社出版的圖書,作者是[美] 斯里達爾?奧拉。內容簡介 本書詳細闡述了與Hadoop 3大數據分析相關的基本解決方案,主要包括Hadoop簡介、大數據分析概述、基於MapReduce的大數據處理、Python-...
《Hadoop 3.x大數據開發實戰(視頻教學版)》是清華大學出版社於2022年出版的書籍,作者是張偉洋 內容簡介 本書以Hadoop 3.x及其周框線架為主線,介紹了整個Hadoop生態系統主流的大數據開發技術。全書共16章,第1章講解VMware中CentOS 7...
《Hadoop大數據開發實戰》是2019年10月人民郵電出版社出版的圖書,作者是楊力。內容簡介 本書將大數據技術生態圈主流技術框架的套用與發展、搭建Hadoop大數據分散式系統集群平台、大數據分散式檔案系統HDFS(Hadoop Distributed File System)、...
1.3大數據時代處理數據理念的改變 3 1.3.1要全體不要抽樣 3 1.3.2要效率不要絕對精確 3 1.3.3要相關不要因果 4 1.4大數據時代的關鍵技術 5 1.5大數據時代的典型套用案例 5 1.5.1塔吉特超市精準行銷案例 5 1.5.2谷歌...
《Hadoop大數據處理技術基礎與實踐(第2版)(微課版)》是2023年人民郵電出版社出版的圖書,作者是安俊秀、靳宇倡、郭英。 內容簡介 全書共有12章,從Hadoop概述開始,介紹了Hadoop的安裝與配置管理,並對Hadoop的生態體系架構進行了介紹,...
使讀者熟悉Hadoop大數據開發兩大核心組件,即HDFS和MapReduce;第3~12章講解Hadoop生態系統各框架HDFS、MapReduce、輸入輸出、Hadoop集群配置、高可用集群、HBase、Hive、數據實時處理系統Flume,以及Spark框架數據處理、機器學習等實戰技術,並...
13.2.3Hadoop集群大數據安全和隱私問題...252 13.3Hadoop平台硬體故障的應對機制...252 13.3.1監控軟硬體故障的應對機制...253 13.3.2斷電處理255 13.4Hadoop平台如何真正做到高可用性.255 13.4.1Hadoop系統的高可用性冗餘性保障...
《Hadoop大數據開發實戰(慕課版)》是2022年人民郵電出版社出版的圖書,作者是千鋒教育高教產品研發部。 內容簡介 共分11章,第1章對大數據及Hadoop進行總體介紹,第2章講解了如何搭建Hadoop集群。第3-5章講解了HDFS分散式檔案系統、Map...
對於有條件的公司和學校,參照書中介紹的搭建過程,同樣可以將實踐平台搭建在多台實體計算機上,以便更加接近於大數據和機器學習真實的運行環境。《Hadoop+Spark大數據巨量分析與機器學習整合開發實戰》非常適合於學習大數據基礎知識的初學者閱讀...
全書共包括3個部分,第 一部分為基礎篇,主要介紹Hadoop數據導入導出、HDFS的概述、Pig與Hive的使用、ETL和簡單的數據處理,還介紹了MapReduce的調試方式;第 二部分為數據分析高 級篇,主要介紹聚合、大數據分析等技巧;第三部分為系統...
《基於Hadoop的大數據分析和處理》是2017年電子工業出版社出版的圖書,作者是魏祖寬、劉兆宏。內容簡介 本書基於雲計算和大數據,介紹大數據處理和分析的技術,分為兩部分。第一部分介紹Hadoop基礎知識,內容包括:Hadoop的介紹和集群構建、...
數據挖掘基礎某知名連鎖餐飲企業的困惑從餐飲服務到數據挖掘數據挖掘的基本任務數據挖掘建模過程1.4.1 定義挖掘目標1.4.2 數據取樣1.4.3 數據探索1.4.4 數據預處理1.4.5 挖掘建模1.4.6 模型評價餐飲服務中的大數據套用小結...
對於有條件的公司和學校,參照書中介紹的搭建過程,同樣可以將實踐平台搭建在多台實體計算機上,以便更加接近於大數據和機器學習真實的運行環境。《Hadoop + Spark 大數據巨量分析與機器學習整合開發實戰》非常適合於學習大數據基礎知識的初學者...
隨著大數據技術的發展和傳統技術的革新,醫療、交通、金融、電商等多個行業已經在使用大數據技術進行海量數據的處理,如疾病預防、出行規劃、股票預測、行為分析等。《Hadoop生態體系項目實戰》為用戶行為日誌分析的實現提供技術指導。《Hadoop...
《Hadoop硬實戰》是2015年1月電子工業出版社出版的圖書,作者是[美]AlexHolmes(亞歷克斯.霍姆斯)。內容簡介 Hadoop是一個開源的MapReduce平台,設計運行在大型分散式集群環境中,提供查詢和分析服務。尤其適用於大數據系統,Hadoop為蘋果、...
《Hadoop數據倉庫實戰》是2019年12月人民郵電出版社出版的圖書,作者是肖睿、蘭偉、廖春瓊。內容簡介 本書以Hive為開發平台,主要介紹了如何使用HiveQL來查詢和分析存儲在Hadoop分散式檔案系統上的大數據集合,具體內容包括Hive入門、Hive數據...
《Hadoop大數據挖掘從入門到進階實戰(視頻教學版)》一書由鄧傑編寫,於2018年6月由機械工業出版社出版發行。內容簡介 本書採用“理論+實戰”的形式編寫,全面介紹了Hadoop大數據挖掘的相關知識。本書秉承循序漸進、易於理解、學以致用和...
本書圍繞Hadoop和Spark這兩個主流技術進行講解,主要內容包括Hadoop環境配置、分散式檔案系統HDFS、分散式計算框架MapReduce、資源調度框架YARN與Hadoop新特性、大數據數據倉庫Hive、離線處理輔助系統、Spark Core、 Spark SQL、Spark Streaming等...
《Hadoop大數據挖掘從入門到進階實戰(視頻教學版)》一書由機械工業出版社出版發行。內容簡介 本書採用“理論+實戰”的形式編寫,全面介紹了Hadoop大數據挖掘的相關知識。本書秉承循序漸進、易於理解、學以致用和便於查詢的講授理念,講解時...
第1章PythonSpark機器學習與Hadoop大數據 1 1.1機器學習的介紹 2 1.2Spark的介紹 5 1.3Spark數據處理RDD、DataFrame、SparkSQL 7 1.4使用Python開發Spark機器學習與大數據套用 8 1.5PythonSpark機器學習 9 1.6SparkMLPipeline機器...
本書圍繞Hadoop和Spark兩個主流大數據技術進行講解,主要內容包括Hadoop環境配置、Hadoop分散式檔案系統(HDFS)、Hadoop分散式計算框架MapReduce、Hadoop資源調度框架YARN與Hadoop新特性、Hadoop分散式資料庫HBase、數據倉庫Hive、大數據離線處理輔助...