《數據科學中的並行計算》是西安交通大學出版社出版的圖書,作者是[美]諾曼•馬特洛夫
基本介紹
- ISBN:9787560599588
- 作者:[美]諾曼•馬特洛夫
- 出版社:西安交通大學出版社
- 出版時間:2017年12月12日
- 頁數:313
- 定價:72.00
- 裝幀:平裝
- 原作品:Parallel Computing for Data Science with Examples in R,C++ and CUDA
- 叢書:R語言套用系列
《數據科學中的並行計算》是西安交通大學出版社出版的圖書,作者是[美]諾曼•馬特洛夫
《數據科學中的並行計算》是西安交通大學出版社出版的圖書,作者是[美]諾曼•馬特洛夫 內容簡介 數據科學家的並行計算必讀手冊 “……一本完整、易讀的並行計算入門——它適合很多學科的研究人員和學生使用。這是一本‘必備’的參考書……” ——戴維•E•吉爾斯,維多利亞大學 “這本書我會既用來當...
相對於串列計算,並行計算可以劃分成時間並行和空間並行。時間並行即流水線技術,空間並行使用多個處理器執行並發計算,當前研究的主要是空間的並行問題。以程式和算法設計人員的角度看,並行計算又可分為數據並行和任務並行。數據並行把大的任務化解成若干個相同的子任務,處理起來比任務並行簡單。空間上的並行導致兩類...
整體同步並行計算模型(Bulk Synchronous Parallel Computing Model),又名大同步模型或BSP模型,由哈佛大學Viliant和牛津大學Bill McColl提出。BSP的創始人是英國著名的計算機科學家Valiant,他希望像馮·諾伊曼體系結構那樣,架起電腦程式語言和體系結構間的橋樑,故又稱作橋模型(Bridge Model)。該模型使用了三個屬性描述...
高性能計算(HighPerformanceComputing)是計算機科學的一個分支,主要是指從體系結構、並行算法和軟體開發等方面研究開發高性能計算機的技術。隨著計算機技術的飛速發展,高性能計算機的計算速度不斷提高,其標準也處在不斷變化之中。高性能計算簡單來說就是在16台甚至更多的伺服器上完成某些類型的技術工作負載。到底這個數量...
資料平行(英語:Data parallelism,又譯為數據平行),是一種多處理器的平行運算模式,將資料分配到不同的平行運算節點中。資料平行把大的任務化解成若干個相同的子任務,處理起來比任務平行簡單。歷史 隨著所羅門機器的發展,數據並行概念的開發始於20世紀60年代。 所羅門機器,也稱為矢量處理器,希望通過處理大型數據...
BSP(Bulk Synchronous Parallel,整體同步並行)模型是個分布存儲的MIMD(多指令流多數據流)計算模型,由哈佛大學的Viliant和牛津大學的Bill McColl提出。一台BSP計算機由”個處理器/存儲器(節點)組成,通過通信網路進行互聯。一個BSP程式有理個進程,每個駐留在一個節點上,程式按嚴格的超步(可以理解為並行運算中子問題...
並行處理計算機主要指以下兩種類型的計算機:①能同時執行多條指令或同時處理多個數據項的單中央處理器計算機;②多處理機系統。並行處理計算機的結構特點 隨著電子器件的發展 ,計算機的處理能力有顯著提高。但是,僅僅依靠器件的進展而達到的速度提高,遠不能滿足現代科學、技術、工程和其他許多領域對高速運算能力的需要。
《基於非結構化張量的海量地理時空數據並行計算模型》是依託南京師範大學,由胡勇擔任項目負責人的面上項目。項目摘要 面向海量地理時空數據結構與分布特徵計算困難,計算效率不高等問題,引入非結構化張量模型,建立點雲、稀疏陣列數據、不規則時空場等海量地理時空數據的非結構化張量表達模式,研究面向海量地理時空數據的...
從理論上說,向量機可以具有和超標量處理機同樣的性能,因此可以說向量機的並行性與超標量機相同。符號處理機是為AI套用而研製的,已用於定理證明、模式識別、專家系統、知識工程、文本檢索、科學以及機器智慧型等許多套用領域。在這些套用中,數據和知識表達式、原語操作、算法特性、存儲器、I/0和通信以及專用的結構特性...
此外,並行數據採集類似於人類接收信息的模式,與人工智慧等前沿科技有十分緊密的聯繫。另外,並行數據處理是計算機與測試測量領域的重要研究內容,其處理數據的一般過程是,首先對於特定實際問題的某幾方面參數進行大量的實時數據並行採集,將其抽象為資料庫內的數據模型;其後利用計算機內的並行算法編程,將數據處理的過程...
機率並行算法 機率並行算法(probabilistic parallel algorithm)是2018年公布的計算機科學技術名詞,出自《計算機科學技術名詞 》第三版。定義 允許算法在執行的過程中隨機並行選擇下一個計算步驟的並行算法。出處 《計算機科學技術名詞 》第三版。
並發互動與通信 並發計算中,不同計算單元之間,需要進行通信以保持同步。這些通信方式,在某些並發程式語言中,是被隱藏起來的(例如,利用future方式)。以外顯方式來進行通信,可分成兩種主要方式:共享記憶體通信,是指經由改變共享記憶體地址內的數據內容,讓不同的並發單元間進行通信,如Java與C#都支持這個方式。使用...
並行算法與串列算法最大的不同之處在於,並行算法不僅要考慮問題本身,而且還要考慮所使用的並行模型,網路連線等等。並行處理系統 並行處理系統是利用多個功能部件或多個處理機同時工作來提高系統性能或可靠性的計算機系統。任何一個計算機系統都包含某種程度的並行性,但如果只具有硬體基本操作的並行性,如一個數據的所有...
本課題研究的內容是分析GPU和CPU並行計算的特點及不同之處,探索將GPU套用於反應堆物理計算中的方法,針對不同的條件,研究適用於CPU-GPU異構並行計算的中子輸運計算方法,包括擴散和輸運計算算法針對GPU計算的改進、異構平台下的算法邏輯和並行計算數據的組織管理等,目的是將計算機硬體的最新進展套用到反應堆物理計算中...
3.2.3 MPI的原始數據類型 ……第4章 程式性能評價與最佳化 第2部分 並行算法設計與實現實例 第5章 自適數值積分 第6章 矩陣並行計算 第7章 FFT算法與套用 第8章 二維Poisson方程 第9章 二維熱傳導方程 第3部分 附錄 附錄A 並行程式開發工具與高性能程式庫 附錄B MPI參考手冊 參考文獻 MPI函式、變數索引 名...
這裡所說的計算技術至少包括機器學習(machine learning)、模式識別(pattern recognition)、知識重現(knowledge representation)、數據庫、組合學(combinatorics)、隨機模型(stochastic modeling)、字元串和圖形算法、語言學方法、機器人學(robotics)、局限條件下的最適推演(constraint satisfaction)和並行計算等。而生物學方面的...
《雲環境下面向大數據並行計算的工作流執行最佳化研究》是依託東南大學,由宋愛波擔任項目負責人的面上項目。中文摘要 目前,針對大數據並行處理的雲計算系統分為三層,分散式檔案系統、數據並行作業執行引擎和編程接口,編程接口負責將複雜套用解析成工作流交由數據並行作業執行引擎處理。然而,當前的雲計算系統不支持工作流...
第一章 並行算法基礎 1.1 並行算法的硬體基礎 1.1.1 當代並行計算機體系結構 1.1.2 並行計算機互連網路 1.2 並行計算模型 1.2.1 SIMD同步並行計算模型 1.2.2 MIMD異步並行計算模型 1.2.3 其他並行計算模型 1.3 並行算法編程模型 1.3.1 數據並行模型 1.3.2 訊息傳遞模型 1.3.3 共享變數模型 1...
《並行計算的編程模型》是2017年機械工業出版社出版的圖書,作者是帕萬·巴拉吉、Pavan Balaji。內容簡介 隨著並行計算時代的到來,計算機科學家更加關注如何設計適用於高性能並行計算以及超級計算系統的編程模型。由於多個處理單元同時計算以及移動數據,並行系統上的編程是十分複雜的。本書作者根據自己多年的實際並行編程經驗...
任務並行(也稱為功能並行和控制並行)是一種形式的並行化的計算機代碼在多個處理器中並行計算環境。任務並行性側重於分配不同處理器上的進程或執行緒同時執行的任務。與涉及在不同數據組件上運行相同任務的數據並行性相反,通過在同一數據上同時運行許多不同任務來區分任務並行。一種常見類型的任務並行是流水線操作,它...
大數據並行處理計算系統 大數據並行處理計算系統是一種用於計算機科學技術領域的計算機及其配套設備,於2013年09月05日啟用。技術指標 HP PHJY X7460 2.67 16MB 6核 580G5處理器。主要功能 大數據處理。
MapReduce是一種編程模型,用於大規模數據集(大於1TB)的並行運算。概念"Map(映射)"和"Reduce(歸約)",是它們的主要思想,都是從函式式程式語言里借來的,還有從矢量程式語言里借來的特性。它極大地方便了編程人員在不會分散式並行編程的情況下,將自己的程式運行在分散式系統上。 當前的軟體實現是指定一個Map...
由於GPU的特點是處理密集型數據和並行數據計算,因此CUDA非常適合需要大規模並行計算的領域。CUDA除了可以用C語言開發,也已經提供FORTRAN的套用接口,未來可以預計CUDA會支持C++、Java、Python等各類語言。可廣泛的套用在圖形動畫、科學計算、地質、生物、物理模擬等領域。2008年NVIDIA推出CUDA SDK2.0版本,大幅提升了CUDA...
框架的設計目標是,像MapReduce一樣高度抽象,可以高效執行與機器學習相關的、具有稀疏的計算依賴特性的疊代性算法,並且保證計算過程中數據的高度一致性和高效的並行計算性能。該框架最初是為處理大規模機器學習任務而開發的,但是該框架也同樣適用於許多數據挖掘方面的計算任務。在並行圖計算領域,該框架在性能上高出...