《深入理解大數據:大數據處理與編程實踐》是機械工業出版社出版的圖書,作者是:黃宜華,副:苗凱翔
基本介紹
- 作者:黃宜華、苗凱翔
- 出版社:機械工業出版社
- 出版時間:2014年8月
- 頁數:520 頁
- 定價:79.00 元
- ISBN:9787111473251
- 叢書:計算機類專業系統能力培養系列教材
《深入理解大數據:大數據處理與編程實踐》是機械工業出版社出版的圖書,作者是:黃宜華,副:苗凱翔
《深入理解大數據:大數據處理與編程實踐》是機械工業出版社出版的圖書,作者是:黃宜華,副:苗凱翔內容簡介【內容簡介】 本書在總結多年來MapReduce並行處理技術課程教學經驗和成果的基礎上,與業界著名企業Intel...
大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中...
《深入理解Flink:實時大數據處理實踐》是2019年4月電子工業出版社出版的圖書,作者是余海峰。內容簡介 本書介紹了當下最流行的實時數據處理引擎Flink,講解了流處理API、批處理API、機器學習引擎FlinkML、關係型API、複雜事件處理FLinkCEP,...
掌握Hadoop分散式檔案系統HDFS的重要概念、體系結構、存儲原理和讀寫過程,並熟練掌握分散式檔案系統HDFS的使用方法;介紹了MapReduce模型,掌握具體工作流程,以及MapReduce的具體套用;介紹了大數據處理架構Spark的基本原理和編程方法;介紹了...
《大數據實踐》是2020年電子工業出版社出版的圖書,作者是伯納德·馬爾。內容簡介 當今世界,科技進步日新月異,網際網路、大數據、雲計算等現代信息技術深刻改變著人類的思維、生產、生活、學習方式,深刻展示了世界發展的前景。大數據是工業...
《雲計算環境下Spark大數據處理技術與實踐》是2017年9月清華大學出版社出版的圖書,作者是鄧立國、佟強。內容簡介 本書圍繞網際網路重大的技術革命:雲計算、大數據進行闡述。雲計算環境下大數據處理構建是國民經濟發展的信息基礎設施,發展自主...
《大數據基礎編程、實驗和案例教程(第2版)》是2020年清華大學出版社出版的圖書,作者林子雨。內容簡介 本實踐教程主要介紹大數據軟體環境的搭建、大數據基礎編程和大數據實驗案例,可以幫助大數據學習者有效構建大數據實驗環境,快速開展入門級...
《大數據技術全解:基礎、設計、開發與實踐》是2014年1月電子工業出版社出版的圖書,作者是楊巨龍。內容簡介 《大數據技術全解:基礎、設計、開發與實踐》可以作為計算機軟體專業的本科生和研究生的大數據技術教材,也可作為大數據技術開發...
為培養學生理解大數據、處理大數據以及大數據系統最佳化的能力,《大數據處理》從思維、編程、最佳化三個方面系統闡述大數據處理的系統架構、編程、最佳化等核心技術以及方法。《大數據處理》內容共9章,包括大數據處理基礎、大數據存儲基礎、大數據管理...
6.1.3 數據處理安全 6.2 大數據安全與可視化數據共享 6.2.1 大數據安全與隱私保護 6.2.2 可視化數據共享 6.3 綜合練習 6.3.1 選擇題 6.3.2 填空題 第7章 數據分析與可視化綜合實踐 本章概要 學習目標 7.1 ...
5.5 HBase在大數據處理中的角色 87 5.6 利用Hive挖掘大數據 89 練習 91 備忘單 94 模組2 管理大數據生態系統 第 1講 大數據技術基礎 97 1.1 探索大數據棧 98 1.2 冗餘物理基礎設施層 99 1.2.1 物理冗餘網路 ...
最近三年,先後承擔了《Linux體系和編程》、《軟體項目管理》、《工程導論》、《計算機組成原理》等本科課程;承擔了《雲計算與大數據》、《並行計算》、《Hadoop處理技術》等研究生課程,學校考核均為優。 在科研工作方面,一直從事雲計算...
講解計算引擎相關技術,涉及批處理、互動式處理以及流式實時處理三類引擎,包括MapReduce、Spark、Impala/Presto、Storm等常用技術。第六部分(第14-16章):數據分析 講解數據分析相關技術,涉及基於數據分析語言HQL與SQL,大數據統一編程模型...
1.2 物聯網與大數據 7 1.3 物聯網產業的機遇與挑戰 9 1.3.1 物聯網產業面臨的挑戰 9 1.3.2 物聯網作業系統與資料庫 10 1.3.3 物聯網大數據處理與套用 11 第2章 大數據處理技術的發展 12 2.1 大數據存儲和管理技術 ...
13.2.3 基於Storm的大數據分析實例 326 13.3 分散式流處理系統Samza 331 13.3.1 Samza簡介 331 13.3.2 Samza的原理 332 13.3.3 基於Samza的大數據分析實例 334 13.4 Cloud Dataflow 339 13.4.1 Cloud Dataflow簡介 339...
《大數據實踐》是2018年6月清華大學出版社出版的圖書,作者是劉鵬、張燕、袁曉東、黃必棟。內容簡介 本書內容涵蓋了目前使用最為廣泛的大數據處理系統Hadoop生態圈中的幾大核心軟體系統:分散式大數據處理系統Hadoop、資料庫HBase、數據倉庫...
在大數據處理與分析篇,首先在第七章介紹了大數據處理和分析的核心技術——分散式並行編程模型MapReduce,然後,在第八章和第九章分別介紹了大數據時代兩種新興的數據分析技術——流計算和圖計算,最後在第十章簡單介紹了可視化技術。在大數據...
第1章 Spark編程模型 1 1.1 Spark:一體化、多元化的高速 大數據通用計算平台和庫 1 1.1.1 為什麼需要使用Spark 5 1.1.2 Spark技術生態系統簡介 9 1.2 Spark大數據處理框架 20 1.2.1 Spark速度為何如此之快 20 1.2.2 ...
《大數據分析與套用實戰:統計機器學習之數據導向編程》是2021年清華大學出版社出版的圖書。內容簡介 本書主要介紹大數據分析與套用,包括數據驅動程式設計、數據前處理、統計機器學習基礎、無監督式學習、監督式學習、其他學習方式(集成學習、...
《Spark大數據處理與分析》是2020年清華大學出版社出版的圖書,作者是雷擎。內容簡介 本書是Spark技術入門的基礎類書籍,通過本書的學習實驗可以牢固掌握Spark編程技術的基本概念、原理和編程方法,能夠進行應用程式的實際開發。圖書目錄 第1...
《大數據評測》,通過分析軟體測試在大數據時代面臨的挑戰,介紹了基於大數據的典型套用,最後對大數據的相關測試技術進行了詳細論述。第一章介紹大數據對軟體測試的挑戰,第二章介紹了大數據的套用,第三章給出了針對大數據處理框架的測試技術...
=第1章 認識大數據和Spark /2 1.1 大數據的介紹 /2 1.2 Apache Spark能做什麼 /3 1.3 其他分散式數據處理框架 /4 1.4 如何使用本書 /4 ∣1.4.1 需要提前具備的基礎 /4 ∣1.4.2 準備相關開發環境 /4 ∣1.4.3 ...
非關係型資料庫篇:以HBase為基礎,重點介紹非關係型資料庫的優勢、原理、部署,以及命令行使用,編程案例,與Sqoop配合使用等。大數據倉庫篇:以Hive、數據倉庫等為基礎,重點介紹數據的抽取、原理、部署、分析與編程。大數據實時計算篇:...
1.5 大數據處理系統的容錯性 1.5.1 數據存儲容錯 1.5.2 計算任務容錯 1.6 大數據處理的雲計算變革 本章參考文獻 第2章 基於Hadoop的大數據處理架構 2.1 Google核心雲計算技術 2.1.1 並行計算編程模型MapReduce 2.1.2 分散式...