《大數據處理》作者是金海, 石宣化。2018年高等教育出版社出版的圖書。該書分基礎技術篇、計算篇和進階篇, 共9章內容, 分別為: 引言、分散式存儲、分散式資源管理與調度、傳統HPC並行計算、數據並行編程框架、sql處理框架、執行層最佳化、sql最佳化和特定套用的數據處理框架。
《大數據處理》作者是金海, 石宣化。2018年高等教育出版社出版的圖書。該書分基礎技術篇、計算篇和進階篇, 共9章內容, 分別為: 引言、分散式存儲、分散式資源管理與調度、傳統HPC並行計算、數據並行編程框架、sql處理框架、執行層最佳化、sql最佳化和特定套用的數據處理框架。
大數據處理技術的多樣化豐富了數據處理的手段,但也給實際套用帶來的困難。由於不存在全能通用的計算框架,多種編程框架需要協同工作才能完成複雜的數據處理任務。例如,典型的機器學習可以組織成數據預處理、特徵提取、訓練和評價等工作流。數...
《大數據處理》作者是金海, 石宣化。2018年高等教育出版社出版的圖書。該書分基礎技術篇、計算篇和進階篇, 共9章內容, 分別為: 引言、分散式存儲、分散式資源管理與調度、傳統HPC並行計算、數據並行編程框架、sql處理框架、執行層最佳化、...
大數據處理 《大數據處理》是2020年北京大學出版社出版的圖書。
大數據處理平台,是一種用於計算機科學技術領域的計算機及其配套設備,於2015年4月27日啟用。技術指標 伺服器8台(配置:CPUXEONE26002.8GHz128GB記憶體300GB*210K轉硬碟),8GbpsFC-SAN光纖通道存儲1套,容量12TB,8Gbps光纖交換機2台,...
《大數據處理框架Apache Spark設計與實現(全彩)》由電子工業出版社於2020年8月出版,作者是許利傑,方亞芬。本書採用問題驅動的敘述方式,強調基本原理的闡述,內容紮實,深入Spark底層。內容簡介 《大數據處理框架Apache Spark設計與實現(...
《Spark大數據處理》是清華大學出版社出版的圖書,作者是劉軍,林文輝,方澄 內容簡介 劉軍, 男,1976年生人,博士,副教授,碩士生導師,北京郵電大學數據科學中心主任。2003年至2007年任職於IBM中國研究院,擔任高級研究員及部門經理,...
《Hadoop大數據處理》是2013年人民郵電出版社出版的圖書,作者是劉軍。內容簡介 《Hadoop大數據處理》以大數據處理系統的三大關鍵要素——“存儲”、“計算”與“容錯”為起點,深入淺出地介紹了如何使用Hadoop這一高性能分散式技術完成大數據...
《實戰Hadoop大數據處理》是2015年8月清華大學出版社出版的圖書,作者是曾剛。內容簡介 本書以“大數據”為起點,較詳細地介紹了Hadoop的相關知識。全書共分為9章,介紹了大數據的基本理論、Hadoop生態系統、Hadoop的安裝、HDFS分散式檔案系統...
《大數據處理之道》是2016年電子工業出版社出版的圖書,作者是何金池。內容簡介 本書覆蓋了當前主流的大數據處理領域的熱門技術,包括Hadoop, Spark, Storm, Dremel/Drill等,詳細的分析了各種技術的套用場景和優缺點。同時,本書闡述了...
《Spark大數據處理: 原理、算法與實例》是2016年9月清華大學出版社出版的圖書,作者是劉軍、林文輝、方澄。內容簡介 本書以時下最為流行的Hadoop所存在的缺陷為出發點,深入淺出地介紹了下一代大數據處理核心技術Spark的優勢和必要性,並...
《大數據預處理技術》是2020年2月人民郵電出版社出版的圖書,作者是朱曉姝、許桂秋。內容簡介 作者針對大數據問題,分析如何進行大數據的導入,如何使用大數據工具進行快速的數據預處理,以及如何構建數據倉庫。詳細講解了Kettle工具的使用、數據...
《企業大數據處理》是2017年機械工業出版社出版的圖書,作者是肖冠宇。內容簡介 這是一本立足於企業真實的商用項目來講解如何高效從事大數據實踐的著作。技術層面,從全棧的角度系統梳理和詳盡講解了大數據的核心技術,包括Spark、Druid、Flume...
《網際網路大數據處理技術與套用》是2017年出版的圖書,作者是曾劍平。內容簡介 本書內容分為三個部分,第一部分為網際網路大數據的概述;第二部分為網際網路大數據的獲取與存儲,包括了靜態或動態WEB頁面內容獲取技術、結構化或非結構化數據的...
《Spark大數據處理技術》是2015年1月電子工業出版社出版的圖書,作者是夏俊鸞、程浩、邵賽賽。內容簡介 本書以Spark 0.9版本為基礎進行編寫,是一本全面介紹Spark及Spark生態圈相關技術的書籍,是國內首本深入介紹 Spark 原理和架構的技術...
《雲計算大數據處理》是2015年人民郵電出版社出版的圖書,作者是劉鵬、於全、楊震宇、陳偉、王磊、張乃甜。圖書簡介 本書介紹了基於雲計算的大數據處理技術,重點介紹了一款高效的、實時分析處理海量數據的強有力工具——數據立方。全書...
大數據處理技術:R語言分析方法與套用 大數據處理技術:R語言分析方法與套用是一本2019年出版的圖書,由智慧財產權出版社出版
大數據處理方法與電信客戶價值管理 《大數據處理方法與電信客戶價值管理》是2020年電子工業出版社出版的圖書。
這些算法不僅要處理大數據的量,也要處理大數據的速度。 [2] 3. Predictive Analytic Capabilities(預測性分析能力) 數據挖掘可以讓分析員更好的理解數據,而預測性分析可以讓分析員根據可視化分析和數據挖掘的結果做出一些預測性的判斷。
金融大數據處理初級 《金融大數據處理初級》是2021年中山大學出版社出版的圖書。
《spark大數據處理技術》是機械工業出版社2021年7月出版的書籍。內容簡介 本書通過兩個基本項目介紹了Scala語言的基本語法、函式式編程、高階函式、模式匹配等相關知識和技術;通過12個實訓項目,介紹了Spark的技術棧,內容涵蓋Spark Core、...
大數據處理:從採集到可視化 大數據處理:從採集到可視化是一本2020年出版的圖書,由武漢大學出版社出版
電網大數據處理技術是一本2022年出版的圖書,由機械工業出版社出版 內容簡介 本書以電網大數據標準化為主線,以電網大數據全生命周期管理過程為載體,重點闡述了電網大數據全生命周期管理的大數據處理技術,包括電網大數據採集技術、電網大數據...
《大數據處理與存儲技術》是2019年2月清華大學出版社出版的圖書,作者是葛維春。內容簡介 本書歸納和總結了主流資料庫軟體和常用數據處理工具的常見問題與套用技巧,為大數據技術與傳統數據存儲和轉換技術相結合提供了技術參考,為促進大數據...
《Spark大數據處理與分析》是2020年清華大學出版社出版的圖書,作者是雷擎。內容簡介 本書是Spark技術入門的基礎類書籍,通過本書的學習實驗可以牢固掌握Spark編程技術的基本概念、原理和編程方法,能夠進行應用程式的實際開發。圖書目錄 第1...
Hadoop大數據處理實戰 《Hadoop大數據處理實戰》是2020年上海交通大學出版社出版的圖書。
大數據處理技術與套用 《大數據處理技術與套用》是2020年清華大學出版社出版的圖書。
《國之重器出版工程:雲計算大數據處理》是2019年10月人民郵電出版社出版的圖書,作者是劉鵬、於全、楊震宇、陳偉、王磊、張乃甜。內容簡介 本書介紹了基於雲計算的大數據處理技術,重點介紹了一款高效的、實時分析處理海量數據的強有力...
大數據,一般指符合4V特徵的數據,包括社交數據、機器數據等,大數據對傳統數據治理工作帶來很多的擴展,在政策/流程上,大數據治理應覆蓋大數據的獲取、處理、存儲、安全等環節,需要為大數據設定數據管理專員制度;需考慮大數據與主數據管理...
《Hadoop大數據處理技術基礎與實踐(第2版)(微課版)》是2023年人民郵電出版社出版的圖書,作者是安俊秀、靳宇倡、郭英。 內容簡介 全書共有12章,從Hadoop概述開始,介紹了Hadoop的安裝與配置管理,並對Hadoop的生態體系架構進行了介紹,...