基本介紹
- 中文名:
- 作者:
- 類別:
- 出版社:
- 出版時間:
- 定價:
- ISBN:
- 著作權方:
《Hadoop大數據處理》是2013年人民郵電出版社出版的圖書,作者是劉軍。內容簡介 《Hadoop大數據處理》以大數據處理系統的三大關鍵要素——“存儲”、“計算”與“容錯”為起點,深入淺出地介紹了如何使用Hadoop這一高性能分散式技術完成大數據...
《實戰Hadoop大數據處理》是2015年8月清華大學出版社出版的圖書,作者是曾剛。內容簡介 本書以“大數據”為起點,較詳細地介紹了Hadoop的相關知識。全書共分為9章,介紹了大數據的基本理論、Hadoop生態系統、Hadoop的安裝、HDFS分散式檔案系統...
1.1.5 Hadoop和雲計算 8 1.2 Hadoop和大數據 9 1.2.1 大數據的定義 9 1.2.2 大數據的結構類型 10 1.2.3 大數據行業套用實例 12 1.2.4 Hadoop和大數據 13 1.2.5 其他大數據處理平台 14 1.3 數據挖掘和...
《Hadoop大數據解決方案》是2017年2月清華大學出版社出版的圖書,作者是[美] Benoy Antony、Konstantin Boudnik、Cheryl Adams、Branky Shao、Cazen Lee、Kai Sasaki。內容簡介 使用Hadoop構建更優秀的大數據解決方案 Hadoop開源且基於Java、...
《Hadoop大數據處理技術基礎與實踐(第2版)(微課版)》是2023年人民郵電出版社出版的圖書,作者是安俊秀、靳宇倡、郭英。 內容簡介 全書共有12章,從Hadoop概述開始,介紹了Hadoop的安裝與配置管理,並對Hadoop的生態體系架構進行了介紹,...
《大數據Hadoop 3.X分散式處理實戰》是2020年4月人民郵電出版社出版的圖書,作者是吳章勇、楊強。內容簡介 本書以實戰開發為原則,以Hadoop 3.X生態系統內的主要大數據工具整合套用及項目開發為主線,通過Hadoop大數據開發中常見的11個典型...
《Hadoop大數據技術原理與套用》是2019年5月清華大學出版社出版的圖書,作者是黑馬程式設計師。內容簡介 本書圍繞Hadoop生態圈相關係統介紹大數據處理架構。全書共11章,其中,第1、2章主要帶領大家認識Hadoop以及學會搭建Hadoop集群;第3~5章...
《基於Hadoop的大數據分析和處理》是2017年電子工業出版社出版的圖書,作者是魏祖寬、劉兆宏。內容簡介 本書基於雲計算和大數據,介紹大數據處理和分析的技術,分為兩部分。第一部分介紹Hadoop基礎知識,內容包括:Hadoop的介紹和集群構建、...
深度學習的計算特點是參數量巨大、更新頻繁,傳統的大數據處理技術如Hadoop,由於數據處理延遲高,並不適合需要頻繁疊代的深度學習,需要針對深度學習的模型結構和計算特徵來設計相應的專用系統。目前大規模的並行訓練是一個熱點問題,特別是...
《大數據處理系統》是浙江大學出版社出版的圖書,作者是毛德操。內容簡介 Hadoop是目前重要的一種開源的大數據處理平台,讀懂Hadoop的原始碼,深入理解其各種機理,對於掌握大數據處理的技術有著顯而易見的重要性。 本書從大數據處理的原理...
結構和設計需求,掌握Hadoop分散式檔案系統HDFS的重要概念、體系結構、存儲原理和讀寫過程,並熟練掌握分散式檔案系統HDFS的使用方法;介紹了MapReduce模型,掌握具體工作流程,以及MapReduce的具體套用;介紹了大數據處理架構Spark的基本原理和...
Hadoop大數據處理技術基礎與實踐 《Hadoop大數據處理技術基礎與實踐》是2015年人民郵電出版社出版的圖書。
本書可作為高職高專院校大數據技術及套用等計算機相關專業的教材使用,也適用於套用型本科院校數據科學與大數據、大數據管理與套用等專業的師生使用。內容簡介 Hadoop是當前熱門的大數據處理與分析平台。《Hadoop大數據開發基礎項目化教程》將...
《Hadoop大數據分析技術》是清華大學出版社於2022年出版的書籍,作者是遲殿委、陳鵬程。內容簡介 伴隨Hadoop的成長,Hadoop不再是一個簡單的數據分散式存儲平台和工具,已經成長為一個完整的生態圈。本書採用Hadoop 3.2.2版本,系統講解...
第1章 大數據和Hadoop生態系統1 1.1 當大數據遇見Hadoop2 1.1.1 Hadoop:直面大數據的挑戰3 1.1.2 商業世界中的數據科學4 1.2 Hadoop生態系統6 1.3 Hadoop核心組件7 1.4 Hadoop發行版9 1.5 使用...
我們設計了多種數據壓縮方法,例如從算法內部的直方圖表述方式、從直方圖的存儲檔案的壓縮等方面;大數據需要不斷的追加新數據,因此提出了數據立方的更新策略,即主立方和子立方共存,適當時機進行重新計算,而非增量更新;(3)基於Hadoop...
大數據時代,需要可以解決大量數據、異構數據等多種問題帶來的數據處理難題,Hadoop是一個分散式系統基礎架構,由Apache基金會開發。用戶可以在不了解分散式底層細節的情況下,開發分散式程式。充分利用集群的威力高速運算和存儲。Hadoop實現了一...
許多Apache Hadoop供應商,提供對Apache Hadoop集群遠程HDFS的接口,是生意量比較大的Apache Hadoop企業首選。因為他們將是在isilon里,進行任何其他Apache Hadoop數據處理大數據的保護,其中包括Apache Hadoop安全和其他問題。另一個好處是,在...
第三篇 大數據處理與項目開發 243 第10章 互動式數據處理 245 10.1 數據預處理 245 10.1.1 查看數據 245 10.1.2 數據擴展 247 10.1.3 數據過濾 247 10.1.4 數據上傳 248 10.2 創建數據倉庫 24...
《Hadoop大數據技術基礎及套用》是2020年3月機械工業出版社出版的圖書,作者是大講台大數據研習社。 內容簡介 本書系統介紹了Hadoop生態系統的核心開發技術,包括:Hadoop大數據技術概述、Hadoop開發及運行環境搭建、HDFS分散式檔案系統、Map...
《Hadoop大數據開發》是2013年人民郵電出版社出版的圖書,作者是劉軍。圖書簡介 《Hadoop大數據處理》以大數據處理系統的三大關鍵要素——“存儲”、“計算”與“容錯”為起點,深入淺出地介紹了如何使用Hadoop這一高性能分散式技術完成大數據...
《Hadoop大數據技術與套用》是2019年12月人民郵電出版社出版的圖書,作者是楊治明、許桂秋。內容簡介 本書採用理論與實踐相結合的方式,全面介紹了Hadoop大數據技術。主要內容包括初識Hadoop大數據技術、Hadoop環境配置,分散式檔案系統HDFS、資源...
全書分為“基礎實驗篇”和“拓展實驗篇”兩篇,共10章,涉及數據採集、數據存儲與管理、數據處理與分析等大數據套用生命周期中各階段典型組件的部署、使用和基礎編程方法。“基礎實驗篇”內容包括部署全分布模式Hadoop集群、實戰HDFS、Map...
本書是為所有熱愛大數據、打算從事大數據相關工作的讀者編寫的,適合有Java編程基礎的學習者參考使用。本書全面介紹了大數據技術生態圈,更在此基礎上全景展現了Hadoop大數據分散式系統集群平台的搭建、大數據分散式檔案系統HDFS、大數據分散式並行...
1.3大數據時代處理數據理念的改變 3 1.3.1要全體不要抽樣 3 1.3.2要效率不要絕對精確 3 1.3.3要相關不要因果 4 1.4大數據時代的關鍵技術 5 1.5大數據時代的典型套用案例 5 1.5.1塔吉特超市精準行銷案例 5 1.5.2谷歌...
《Hadoop大數據技術原理與套用(第2版)》是2023年清華大學出版社出版的圖書,作者是黑馬程式設計師。內容簡介 本書以Hadoop 3.x為主線,全面介紹Hadoop及其生態體系中常用的大數據開源項目的安裝和使用。全書共11章,分別講解大數據概念、Hadoop...
自此,Hadoop成為Apache開源組織下最重要的項目,自其推出後很快得到了全球學術界和工業界的普遍關注,並得到推廣和普及套用。MapReduce的推出給大數據並行處理帶來了巨大的革命性影響,使其已經成為事實上的大數據處理的工業標準。儘管Map...
運行在HDFS上的程式也是用於處理大數據集的。這些程式僅寫一次數據,一次或多次讀數據請求,並且這些讀操作要求滿足流式傳輸速度。HDFS支持檔案的一次寫多次讀操作。HDFS中典型的塊大小是64MB,一個HDFS檔案可以被切分成多個64MB大小的塊,...