《針對GPU的高效並行任務執行設計研究》是依託北京大學,由梁雲擔任負責人的青年科學基金項目。
基本介紹
- 中文名:針對GPU的高效並行任務執行設計研究
- 項目負責人:梁雲
- 項目類別:青年科學基金項目
- 依託單位:北京大學
《針對GPU的高效並行任務執行設計研究》是依託北京大學,由梁雲擔任負責人的青年科學基金項目。
《針對GPU的高效並行任務執行設計研究》是依託北京大學,由梁雲擔任負責人的青年科學基金項目。項目摘要現代的圖形處理器(GPU)已成為廣泛使用的高性能計算平台。GPU對多種不同的套用都有著巨大的計算潛力。隨著越來越多的通用...
GPU-MOABC);建立考慮參數波動和多個質量特性互相衝突的多回響穩健最佳化數學模型,探討多回響穩健最佳化模型的解耦技術和求解方法,並在GPU 平台上實現並行化。以泡沫鋁填充薄壁結構的耐撞性最佳化設計為例,驗證提出的方法的有效性。該項目的研究成果為大幅提高複雜產品的設計水平提供一個高效的解決方案。
《基於GPU的並行排序算法設計與最佳化》是依託清華大學,由都志輝擔任項目負責人的面上項目。項目摘要 利用GPU來加速科學問題的求解已成為高性能計算的一個重要研究方向,而排序算法是一個非常基礎的算法,設計基於GPU的並行排序算法可以直接支持一大類科學計算套用。基於對GPU內部層次化記憶體模型和流處理單元的抽象與分析,...
《四維變分同化CPU/GPU協同並行計算研究》是依託中國人民解放軍國防科技大學,由朱小謙擔任項目負責人的面上項目。中文摘要 四維變分同化是當前數值天氣預報領域極有價值的資料同化方法,對於提高中期數值天氣預報效果起到了關鍵作用,但是其巨大的計算量是制約技術發展和業務化的重要因素,開展四維變分同化並行算法研究具有...
同一視窗多執行緒高效並行繪製方法;(2)節點內多CPU多GPU間數據預存取管理方法;(3)節點內多CPU多GPU並行可視化算法存儲最佳化與任務調度算法;(4)節點內多CPU多GPU協同混合加速並行繪製算法;(5)GPU集群環境下,面向海量數據可視化套用的並行繪製算法;(6)面向多CPU多GPU並行算法設計平台與並行繪製平台。
《基於GPU並行的反應堆物理計算方法研究》是依託清華大學,由余綱林擔任項目負責人的青年科學基金項目。項目摘要 反應堆物理計算方法是核反應堆研究和設計的基礎,隨著先進核能技術的發展,對反應堆物理計算的計算速度和精度都提出了很高要求,而並行計算技術是提高反應堆物理計算效率的最有效手段之一,近年來隨著基於GPU(...
《GPU並行算法——N-S方程高性能計算》是2020年科學出版社出版的圖書,作者是白智勇,李志輝。內容簡介 本書共九章,重點通過基礎知識講解、算例剖析和技巧提示,引導讀者熟悉GPU並行算法、CUDA Fortran基礎知識,進而掌握基於CUDA Fortran的GPU高性能計算套用軟體設計方法。其中,第1章介紹相關研究背景;第2~6章介紹基於...
2.1 第一個並行程式 2.1.1 imflipP.c中的main()函式 2.1.2 運行時間 2.1.3 imflipP.c中main()函式代碼的劃分 2.1.4 執行緒初始化 2.1.5 創建執行緒 2.1.6 執行緒啟動/執行 2.1.7 執行緒終止(合併)2.1.8 執行緒任務和數據劃分 2.2 點陣圖檔案 2.2.1 BMP是一種無損/不...
《gpu高性能編程cuda實戰》是2011年機械工業出版社出版的中譯圖書,作者是美國Jason Sanders和Edward Kandrot。內容簡介 CUDA是一種專門為提高並行程式開發效率而設計的計算架構。在構建高性能應用程式時,CUDA架構能充分發揮GPU的強大計算功能。本書首先介紹了CUDA架構的套用背景,並給出了如何配置CUDA c的開發環境。然...
(4)研究和搭建了硬體環境,又研究了多GPU,多節點並行計算的並行策略設計,完善了基於檢查點的GPU/CPU協同並行計算策略,節點間採用MPI訊息傳遞並行策略。實驗證明,GPU計算可以很大幅度的提高計算效率。(5)用於多次波預測的速度建模也有了發展。設計實現了兩種速度建模的工具。一是利用圖片的不同顏色方便為地震波...
本課題目標是研發一套核心領域專用程式語言(Domain Specific Language, DSL) 研發平台以及相應的最佳化編譯器,並據此對若干領域系統性地研發支持自動GPU 並行化的DSL。除基礎平台的研發外,課題在程式建模、物理計算、運動特效繪製等領域分別展開了DSL的設計研究。 立項以來,課題按照任務書計畫,在GPU的DSL基礎平台研發...
9.1 策略1:並行/串列在GPU/CPU上的問題分解286 9.1.1 分析問題286 9.1.2 時間286 9.1.3 問題分解288 9.1.4 依賴性289 9.1.5 數據集大小292 9.1.6 解析度293 9.1.7 識別瓶頸294 9.1.8 CPU和GPU的任務分組297 9.1.9 本節小結299 9.2 策略2:記憶體因素299 9.2.1 記憶體頻寬299 9.2....
為解決高階MoM計算能力受計算機記憶體限制的難題,本項目設計了基於CPU的高階MoM並行核外策略。為進一步提高算法的求解效率和計算能力,本項目研究了基於GPU的並行核外求解技術,採用異步通信技術與cuda流技術實現了兩級核外的通信最佳化,建立了“顯存-記憶體-硬碟”的兩級核外求解模式,完善了高階MoM並行核外體系。 本...
進一步地,建立起完整的基於GPU的仿真框架,設計了GagentData、Gagent、GModel、GWorld、GVisuial、GRandom等模組及其相應的API,通過簡單的函式調用及參數設定,就能夠構建並運行個性化的多智慧型體仿真場景。 基於以上研究,在並行仿真、多智慧型體仿真等領域,開發了一種面向並行化的建模與仿真語言,實現了高超聲速飛行...
JFNK方法的效率在很大程度上依賴於Newton疊代中Krylov子空間方法的預條件子,本項目對多種預條件子進行了研究,包括傳統求解器LU-SGS、Jacobi、點鬆弛PRSGS以及加性Schwarz區域分解預條件子。提出了兩層GPU並行算法,區塊內基於CUDA編程模型的細粒度數據並行算法以及區塊間基於GPU流處理的粗粒度任務並行算法。針對複雜外...
通過四年的研究,本項目很好的完成了預定的任務,在以下兩個方面取得了重要成果:一、程式發展:(1)編寫了自能計算、非平衡格林函式計算GPU程式,編寫CULA和CUBLAS的fortran調用程式接口;(2)發展了分塊矩陣計算算法,實現超大矩陣的矩陣相乘與矩陣求逆的GPU計算;(3)實現多GPU的k點並行和能量並行;(...
以此為基礎,研究該方法的GPU並行方案,在高性能計算伺服器上實現上億自由度的三維CSAMT法快速、高精度正演。通過典型地電模型測試並改進算法,為方法的進一步套用奠定基礎。本項目的研究對促進勘探電磁法正反演的快速發展,提高資料解釋水平,具有重要的理論和實際意義。結題摘要 可控源音頻大地電磁法(CSAMT)是近年發展...
GPU(圖形處理單元)因其在並行計算方面的優勢,正廣泛套用於高性能計算和雲計算領域。GPU虛擬化作為這種趨勢的技術支撐,將GPU設備共享給多個用戶以提高硬體資源的使用和管理效率,但同時也帶來了安全風險。 特別地,雲計算環境GPU虛擬化場景中的安全問題包括以下兩個方面,第一,在串列調度的GPU虛擬化方法中,惡意任...
4.2.9多GPU並行計算算法 4.3實例套用 4.3.1單GPU計算實例 4.3.2多GPU並行計算實例 4.4性能分析 4.4.1單GPU不同算法的比較 4.4.2多GPU並行計算 4.5一些GPU程式開發調試經驗 第5章長鏈分子分子動力學模擬的GPU實現 5.1長鏈分子分子動力學模擬的常用模型和算法 5.2算法的GPU實現 5.2.1粒子信息的...
本項結合GPU 並行計算的特點,從效率分析、模型研究、算法設計和平台構建方面將並行計算理論加以發展並套用於電力系統電磁暫態仿真分析。在效率分析方面,提出了適用於電磁暫態計算的GPU基本運算耗時評估模型,研究影響GPU 並行計算效率的關鍵因素,在此基礎上為分配GPU計算任務提供理論支撐。在模型研究方面,面向變流器外特性...
結合不同行業和套用領域知識,由專業技術人員人工設計和提取特徵是前深度學習時代的一項重要研究任務,這一工作也被稱為特徵工程。深度學習的強大之處在於將特徵工程這一費時費力的工作轉變為由機器自動完成,這也是深度學習得以廣泛套用的核心價值。與神經網路的關係 神經網路的發展遠早於深度學習。但在神經網路技術發展...
為此,本申請項目通過擴展顆粒模型構造具有複雜幾何形態的顆粒單元,並發展相應的接觸模型以準確計算單元間的作用力;針對複雜形態顆粒離散元的接觸模式,研究基於GPU並行技術的高性能數值算法,並重點研究顆粒單元間接觸判斷的快速搜尋方法,研發基於GPU實時顯示技術的後處理系統;對複雜形態顆粒物質在筒倉內的流動過程進行大...
關於AMD APP加速並行處理技術的更多內容,請參考AMD APP詞條。 APP既是生成技術就是套用可以即時自動生成的技術,用戶僅需要做一些分析和描述,然後對圖形界面進行排布,即可完成APP的設計的一種技術——親愛的程式設計師們。視頻處理 AMD顯示卡驅動中自帶的ATI Video Converter便是基於APP技術的視頻轉碼軟體,ATI Video ...
Isaac Gym是由NVIDIA推出的第一款專注於高性能物理仿真和強化學習開發框架,專為大規模並行計算和深度強化學習設計。它將物理仿真與GPU加速相結合,使得智慧型體的訓練速度大幅提升,特別適合複雜機器人任務和高維度控制問題的研究。Isaac Gym通過利用NVIDIA GPU的強大計算能力,實現了數千個環境的並行模擬,大大縮短了智慧型...
而從巨觀的角度來看,將任務指派給能源效率最高的硬體是聰明的做法,從而實現整個系統的能源利用最佳化,其中的典型例子就是將高並行計算任務交給GPU完成。如果從更長遠的角度來看,雲計算的普及可以讓用戶使用低能耗的“瘦終端”,從而有效降低整個IT環境的能源總消耗。而伺服器本身則可以採取彈性的任務分派和靈活的能源...
還有,通過新的OpenSubdiv支持和雙四元數蒙皮,美工人員可以更高效地建模,新的攝影機序列器可以更有條理地控制內容呈現。新的設計工作區提供基於任務的工作流,方便用戶使用軟體的主要功能;新的模板系統為用戶提供了基線設定,因此可以更快速地開始項目,渲染也更順利。主要功能和優勢 Max Creation Graph 3ds Max 2016...
MindSpore Federated設計了松耦合分散式伺服器、限時通信模組、容忍退出的安全聚合等模組,使得任何時候只要部分客戶端可用,都可以進行聯邦學習任務,並解決了系統異構帶來的“長尾效應”,提高了學習效率。搭載於昇思MindSpore端邊雲全場景統一的基礎架構,MindSpore Federated將會作為華為終端的核心競爭力之一,在保護用戶隱私...
而運用這種方法開發需要達到以下要求:(1)軟體的通用性較強,具有高度的集成性和複雜度,二次開發較為方便,在WindOws下具有友好的人機界面,能充分利用網路進行分散式管理;(2)能有效地區分科學計算核心和其他管理功能的開發任務,使負責編寫科學計算程式的工程師與負責其它設計任務的程式設計師的工作能夠清楚地分開,讓...
這些問題的解決,有賴於兩方面的努力:一是創造出更高效的計算方法,一是大大提高計算機的速度。作用 什麼是科學計算? 粗略地說,科學計算是指利用計算機再現、預測和發現客觀世界運動規律和演化特性的全過程,包括建立物理模型,研究計算方法,設計並行算法,研製應用程式,開展模擬計算和分析計算結果等過程,圖1 是一...
飛槳螺旋槳生物計算平台PaddleHelix,面向小分子創新藥、多肽/蛋白藥物和mRNA 疫苗設計等場景提供AI能力。在新藥研發上,提供基於大規模數據預訓練的分子表征和蛋白表征模型,助力分子生成、藥物篩選、化合物合成等任務,同時提供從分子生成到藥物篩選到全流程pipeline。在疫苗設計上,Linear系列算法相比傳統方法效率大幅提升,...