《Hadoop數據分析》是2020年3月人民郵電出版社出版的圖書,作者是[美]班傑明·班福特、[美]珍妮·基姆。
基本介紹
- 書名:Hadoop數據分析
- 作者:[美]班傑明·班福特、[美]珍妮·基姆
- ISBN:9787115479648
- 頁數:211頁
- 定價:69元
- 出版社:人民郵電出版社
- 出版時間:2020年3月
- 裝幀:平裝
- 開本:16開
《Hadoop數據分析》是2020年3月人民郵電出版社出版的圖書,作者是[美]班傑明·班福特、[美]珍妮·基姆。
《Hadoop數據分析》是2020年3月人民郵電出版社出版的圖書,作者是[美]班傑明·班福特、[美]珍妮·基姆。內容簡介 通過提供分散式數據存儲和並行計算框架,Hadoop已經...
本書詳細闡述了與Hadoop 3大數據分析相關的基本解決方案,主要包括Hadoop簡介、大數據分析概述、基於MapReduce的大數據處理、Python-Hadoop科學計算和大數據分析、R-...
這些數據可以來自於各種源,但是最常見的數據是通過作為物聯網的一部分的感測器創造的數據。為了讓其分析處理是有價值的,Hadoop必須快速處理這些數據集,而且要通過...
《基於Hadoop的大數據分析和處理》是2017年電子工業出版社出版的圖書,作者是魏祖寬、劉兆宏。內容簡介 本書基於雲計算和大數據,介紹大數據處理和分析的技術,分為...
數據轉換60 數據分析62 總結 63 第4 章 使用Hadoop 進行數據遷移. 65 項目細節——歸檔你的交易數據65 解決方案67 項目第一階段——分裂交易數據到數據倉庫和...
第13章 尋找石油:使用ApacheMahout分析地理數據173 13.1 基於領域的ApacheMahout推理介紹173 13.2 智慧型製圖系統和Hadoop分析179 13.3 本章小結180 13.4 參考...
大數據分析發展狀況 編輯 開源大數據1. Hadoop HDFS、Hadoop MapReduce, HBase、Hive 漸次誕生,早期Hadoop生態圈逐步形成。2. Hypertable是另類。它存在於Hadoop生態...
離線數據分析 離線數據分析用於較複雜和耗時的數據分析和處理,一般通常構建在雲計算平台之上,如開源的HDFS檔案系統和MapReduce運算框架。Hadoop機群包含數百台乃至數...
本書全面介紹了Hadoop大數據分析的基礎知識、14個核心組件模組及4個項目實戰案例。為了幫助讀者高效、直觀地學習,作者特意為本書錄製了20小時同步配套教學視頻。本書...
Hadoop的安裝、HDFS分散式檔案系統、MapReduce的原理及開發、HBase數據庫、Hive數據倉庫、Sqoop數據轉換工具,最後結合實際介紹了大數據在智慧型交通和情報分析中的套用。
《Hadoop海量數據處理:技術詳解與項目實戰》是2016年1月人民郵電出版社出版的圖書,作者是范東來。內容簡介 《Hadoop海量數據處理:技術詳解與項目實戰》介紹了Hadoop...
《Hadoop海量數據處理技術詳解與項目實戰(第2版)》是2015年人民郵電出版社出版的圖書,作者是范東來。基本簡介 本書介紹了Hadoop技術的相關知識,並將理論知識與...
《大數據分析與數據挖掘》是2016年清華大學出版社出版的圖書,作者是簡禎富、許嘉裕。...
《Hadoop海量數據處理:技術詳解與項目實戰(第2版)》是2020年3月人民郵電出版社出版的圖書,作者是范東來。內容簡介 本書介紹了Hadoop技術的相關知識,並將理論...
2.1 氣象數據集 19 2.2 使用Unix工具來分析數據 21 2.3 使用Hadoop來分析數據 22 2.3.1 map和reduce 23 2.3.2 Java MapReduce 24 2.4 橫向擴展 31 ...
第1章 Hadoop概述 1 1.1 商業分析與大數據 2 1.1.1 Hadoop的組件 3 1.1.2 Hadoop分散式檔案系統(HDFS) 3 1.1.3 MapReduce是什麼 4 1.1.4 YARN是...
《大數據離線分析》是2017年清華大學出版社出版的圖書,作者是傅德謙、趙向兵、張林濤、劉鳴濤。內容簡介 本書基於開源Hadoop大數據生態圈的主流離線分析工具Hive和...
《Hadoop海量數據處理:技術詳解與項目實戰》介紹了Hadoop技術的相關知識,並將理論知識與實際項目相結合。全書共分為三個部分:基礎篇、套用篇和總結篇。基礎篇詳細...
2.2大數據分析的概念14 2.3大數據分析的關鍵技術15 2.3.1雲計算15 2.3.2數據分析方法16 2.3.3數據可視化17 2.4大數據分析工具介紹17 2.4.1Hadoop18 ...
10.2.1數據 10.2.2ggmap 第四部分RHadoop案例分析 第11章RHadoop的基本操作 11.1數據檔案的讀取 11.2包的載入 11.3基本函式 第12章RHadoop環境下案例...
智慧型數據分析,它是指運用統計學、模式識別、機器學習、數據抽象等數據分析工具從數據中發現知識的分析方法。智慧型數據分析的目的是直接或間接地提高工作效率,在實際使用...
4.3 磁碟元數據檔案 43 4.4 format情景分析 45 4.5 元數據套用場景分析 56 思考練習 57 第5章 Hadoop的元數據備份方案 58 5.1 運行機制...
針對政府、金融、電信、零售、網際網路、電商、醫學等行業專門從事數據分析與雲端大數據的人員。可掌握Python和Linux作業系統;運用Hadoop、Hive、Spark等專業大數據架構及...
如果數據量大到“大數據”的程度,那么還需要一些專門的大數據處理平台如Hadoop或數據庫分析機如0racle的Exadata。面臨的困境 21世紀以來,爆炸性增長的“未來新石油...
4.4.4ZooKeeper的數據模型 100 4.4.5ZooKeeper的常用接口及操作 102 4.4.6ZooKeeper的套用場景分析 105 4.5小結 108 5 Hadoop資源管理與調度 110 5.1Hadoop...
《R大數據分析實用指南》是2020年1月人民郵電出版社出版的圖書,作者是[英]西蒙·沃克威克(Simon Walkowiak)。...
第11章Hadoop生態系統 11.1Hadoop系統架構 11.2HDFS分散式檔案系統 11.2.1HDFS體系結構 11.2.2HDFS存儲結構 11.2.3數據容錯與恢復 11.2.4Hadoop/HDFS安裝 1...