基本介紹
- 中文名:大數據實時計算與套用
- 作者:吳斌
- 出版社:清華大學出版社
- 出版時間:2018年7月
- 定價:36 元
- ISBN:9787302503217
《大數據實時計算與套用》是2018年7月清華大學出版社出版的圖書,作者是吳斌。內容簡介本書定位於大數據專業核心技術——實時計算,重點討論大數據套用場景中的數據特點和套用需求的實時流計算技術。本書通過對分散式實時計算系統的...
大數據技術與套用研究方向是將大數據分析挖掘與處理、移動開發與架構、軟體開發、雲計算等前沿技術相結合的“網際網路+”前沿科技專業。本專業旨在培養學生系統掌握數據管理及數據挖掘方法,成為具備大數據分析處理、數據倉庫管理、大數據平台綜合部署、大數據平台套用軟體開發和數據產品的可視化展現與分析能力的高級專業大數據技術...
數據計算及套用(Data Computation and Application)是中國普通高等學校本科專業。本專業培養具有數學基礎和數學思維能力,掌握信息科學和統計學的基本理論、方法與技能,接受科學研究的初步訓練,具備一定的數據建模、高性能計算、大數據處理以及程式設計能力,能運用所學知識與技能解決數據分析、信息處理、科學與工程計算等...
2. 基於框架的通用性,MapReduce代碼也會在HDFS中傳送,在各計算Node展開,再通過啟動新JVM進程裝載並運行。3. 類似的JVM進程啟停有5、6次之多。4. Reduce Task只能在所有Map Task完成之後才能啟動。在HadoopMapReduce框架之外,衍生出了一批低延遲的大數據分析項目:Cloudera Impala, MapR Drill, HBase Coprocessor...
大數據技術與套用課程共8個模組,包括大數據概述、HDFS分散式檔案系統、大數據可視化、Hadoop基礎、Spark計算引擎、HBase分散式資料庫、MapReduce編程框架等內容。課程性質 課程定位 大數據技術與套用課程是信息管理等專業的必修課,且具有理論性和套用性特徵。該課程使學習者通過對基於Spark的關聯分析、HBase數據表基本操作、...
全書分為9章,全面介紹了大數據技術的相關基礎知識、HDFS和資料庫、採集傳輸工具、挖掘分析算法、Spark計算框架、可視化、大數據安全、大數據套用等內容,著重介紹了HDFS分散式檔案系統、NoSQL等各種資料庫、數據倉庫Hive,以及數據採集分析技術,並配套了詳細的實驗教程以及練習題。本書適合作為高等院校計算機、軟體工程、...
《大數據技術及套用教程(第2版)》是2023年清華大學出版社出版的圖書,作者是李聯寧。內容簡介 本書詳細介紹了大數據技術的基礎理論和主流前沿技術。全書共分9章,分別介紹目前面臨的大數據時代、大數據系統的基本結構、大數據採集與預處理、大數據處理基礎架構——雲計算、計算模式與處理系統、查詢展現與互動、大數據分析...
分析師團隊認為,大數據(Big data)通常用來形容一個公司創造的大量非結構化數據和半結構化數據,這些數據在下載到關係型資料庫用於分析時會花費過多時間和金錢。大數據分析常和雲計算聯繫到一起,因為實時的大型數據集分析需要像MapReduce一樣的框架來向數十、數百或甚至數千的電腦分配工作。大數據需要特殊的技術,以...
《Storm:大數據流式計算及套用實踐》是2015年3月電子工業出版社出版的圖書,作者是丁維龍、趙卓峰、韓燕波。內容簡介 Storm作為實時的、分散式以及具備高容錯的流式計算系統,對比適於海量數據批處理的hadoop,不僅簡化了數據流上相關處理的並行編程複雜度,也提供了數據處理實時性、可靠性和集群節點動態伸縮的特性。本書...
《雲計算與大數據技術套用》是2019年機械工業出版社出版的圖書,作者是安俊秀 、靳宇昌 。內容簡介 本書全面介紹了雲計算與大數據的基礎知識和主要技術。全書共11章,主要內容包括雲計算概述、大數據技術概述、虛擬化技術、數據中心、並行計算與集群技術、雲存儲技術、OpenStack、Hadoop、Spark、Storm以及雲計算仿真,本書...
本叢書(第一批)共包括以下分冊:《匯計畫在行動》、《大數據測評》、《數據密集型計算和模型》、《智慧城市大數據》、《城市發展的數據邏輯》、《金融大數據》、《城市交通大數據》、《醫療大數據》。分冊主要內容 《匯計畫在行動》,是本套叢書的導論,對大數據的含義、動態、技術、套用等方面進行了概括介紹,對匯...
基於此,《基於雲計算的大數據處理技術發展與套用》對這一主題展開了研究。作品鑑賞 該書研究視野寬闊,在主題上抓住了雲計算技術對計算機數據處理的重要價值,所涉及的內容符合大數據時代創新發展方向,具有較好的科普效果。隨著網際網路的全面普及,網路使用群體日益增大,其中涵蓋的網路數據範圍也越來越廣,雲計算套用的...
1.4 大數據的套用 14 1.5 大數據關鍵技術 14 1.6 大數據計算模式 15 1.6.1 批處理計算 16 1.6.2 流計算 16 1.6.3 圖計算 16 1.6.4 查詢分析計算 17 1.7 大數據產業 17 1.8 大數據與雲計算、物聯網 18 1.8.1 雲計算 18 1.8.2 物聯網 21 1.8.3 ...
同時涉及4個不同業務背景的29個項目任務,包括17個職業院校技能大賽項目任務,可幫助讀者切實掌握大數據預處理、離線分析和實時計算的實踐技能。《大數據技術實訓教程:預處理、離線分析和實時計算》可作為職業院校、套用型本科院校計算機套用技術、軟體技術、軟體工程、網路工程和大數據技術等計算機相關專業的教材,還可供...
該書內容包括:大數據計算分析技術概述、大數據計算分析常用算法及場景、大數據離線計算分析技術、大數據流式計算分析技術、機器學習在計算分析中的套用,最後還以出入境管理風險評估大數據平台的設計與實現為例,設定了綜合前述知識的實戰項目。該書可作為高等學校大數據、雲計算、人工智慧等相關專業教材,同時也可作為大數據...
支撐這些的,是對大數據的分散式計算、倉庫建設、數據挖掘、高並發網站構建、數據可視化等各個領域前沿技術的深入探索和套用。編輯推薦 Storm以其簡單、靈活、健壯而著稱。隨著大數據實時處理需求的強勁增長,Storm的出現填補了大數據處理生態系統的缺失,並被越來越多的公司所採用。《Storm實戰:構建大數據實時計算 》來自...
大數據技術原理與套用課程圍繞“構建知識體系、闡明基本原理、引導初級實踐、了解相關套用”的指導思想,對大數據知識體系進行系統梳理。該課程共十四講,主要包括大數據概述、大數據處理架構Hadoop、分散式檔案系統HDFS、分散式資料庫HBase、NoSQL資料庫、雲資料庫、MapReduce、Hadoop架構再探討、數據倉庫Hive、Spark、流計算、...
《大數據時代:雲計算技術原理及套用》是吉林大學出版社出版的圖書。內容簡介 本書主要從昂首闊步邁入雲時代、大數據時代的新變化、大數據到雲端的轉變、雲計算開發環境搭建、分散式檔案系統裝載、並行計算的編程模型、建設大數據存儲倉庫、分散式鎖原理與編程、數據的挖掘及其處理、社會中的大數據價值、雲下大數據開發套用、...
大數據套用已成為行業熱點和產業發展新增長點,數據科學與計算技術也是計算機的前沿領域,其中,大數據計算分析提供了核心的技術支撐。本課程從大數據計算系統的三個層次對數據模型、處理算法、計算模型與架構、開發技術標準等內容進行了綜合性的介紹,重點闡述了各類數據分析算法和MapReduce,圖並行計算,互動式處理,流計算...
對從事雲計算與大數據分析工作的財政金融、政府管理、計算機網路、軟體工程的方面的管理與工程技術人員也有學習參考價值。圖書目錄 第1章大數據技術基本概念31.1數據3 1.1.1數據的單位4 1.1.2數據與信息的關係4 1.1.3數據的分類4 1.2信息6 1.2.1信息的定義6 1.2.2信息資源7 1.2.3信息的套用意義8 1....
智慧計算是從數據中獲得信息和知識的複雜計算套用,是未來主要的計算形態。定義 智慧計算是從數據中獲得信息和知識的複雜計算套用,以雲計算為基礎平台、大數據為認知方法、深度學習為最佳化手段 組成要素 雲計算、大數據、深度學習共同構成了智慧計算三要素,雲計算作為計算、存儲等資源的基礎平台,為智慧計算提供算力的承載...
大數據(Big data)通常用來形容一個公司創造的大量非結構化和半結構化數據,這些數據在下載到關係型資料庫用於分析時會花費過多時間和金錢。大數據分析常和雲計算聯繫到一起,因為實時的大型數據集分析需要像MapReduce一樣的框架來向數十、數百或甚至數千的電腦分配工作。在現今的社會,大數據的套用越來越彰顯他的...
1.9.3 雲計算服務部署的環境 ···023 1.9.4 雲計算和大數據的關係 ···023 1.10 物聯網 ···0231.11 數字經濟 ···
6.6.3數據處理的時效性保證——記憶體計算 6.6.4對於流式數據的實時處理 6.6.5大數據套用 6.6.6大數據發展趨勢 習題 第7章實時醫療大數據分析案例 7.1案例背景與需求概述 7.1.1背景介紹 7.1.2基本需求 7.2設計方案 7.2.1ETL 7.2.2非格式化存儲 7.2.3流處理 7.2.4訓練模型與結果預測 7.3環境...
在此,我們整合了近年來大數據研究中在統計理論和套用方面的核心成果,系統地形成了大數據的統計技術知識體系。本書共 6章,內容包括大數據發展的新態勢、統計學的未來發展動態、數據準備技術、大數據的統計技術體系,及其在計算社會經濟學、計算社會醫學、企業數位化轉型等方面的套用。 本書內容新穎,體系清晰,案例充實...
《大數據處理技術套用與實踐》是2023年1月北京郵電大學出版社出版的圖書,作者:王曉光 劉 芳。內容簡介 本書介紹了大數據發展歷程、基本概念、主要影響、套用領域、關鍵技術、計算模式和產業發展,雲計算、物聯網的概念及其與大數據之間的緊密關係;介紹了Hadoop的發展歷史、重要特性和套用現狀,Hadoop項目結構及其各個組件...
11.4在YARN上運行計算框架 11.4.1MapReduceonYARN 11.4.2SparkonYARN 11.4.3YARN程式設計 11.5阿里雲伏羲調度系統 11.5.1伏羲調度系統架構 11.5.25K挑戰 11.5.3伏羲最佳化實踐 11.6習題 第三部分大數據分析與套用 第12章數據分析 12.1數據操作與繪圖 12.1.1數據結構 12.1.2繪圖功能 12.2初級數據...
《雲計算和大數據技術:概念·套用與實戰(第2版)》是2022年人民郵電出版社出版的圖書,作者是王鵬、李俊傑、謝志明、石慧、黃焱。 內容簡介 本書全面介紹雲計算與大數據的基礎知識、主要技術、基於集群技術的資源整合型雲計算技術和基於虛擬化技術的資源切分型雲計算技術。全書共10章,主要內容包括雲計算基礎與大數據...
時空數據由於其所在空間的空間實體和空間現象在時間、空間和屬性三個方面的固有特徵,呈現出多維、語義、時空動態關聯的複雜性,因此,需要研究時空大數據多維關聯描述的形式化表達、關聯關係動態建模與多尺度關聯分析方法,時空大數據協同計算與重構提供快速、準確的面向任務的關聯約束。具體特點包括:1)時空數據包含對象、...