《基於GPU的並行排序算法設計與最佳化》是依託清華大學,由都志輝擔任項目負責人的面上項目。
基本介紹
- 中文名:基於GPU的並行排序算法設計與最佳化
- 依託單位:清華大學
- 項目負責人:都志輝
- 項目類別:面上項目
《基於GPU的並行排序算法設計與最佳化》是依託清華大學,由都志輝擔任項目負責人的面上項目。
《基於GPU的並行排序算法設計與最佳化》是依託清華大學,由都志輝擔任項目負責人的面上項目。項目摘要利用GPU來加速科學問題的求解已成為高性能計算的一個重要研究方向,而排序算法是一個非常基礎的算法,設計基於GPU的並行排序算...
第6章CUDA Fortran程式最佳化 第7章高超聲速流場數學模型 第8章N-S方程並行算法 第9章N-S方程求解的GPU異構並行算法 附錄A純空氣化學非平衡模型相關常數 附錄BN-S方程及其無黏通量特徵分裂 附錄C化學源項及黏性通量雅可比矩陣 附錄D...
2.3.4最佳化 2.3.5重建圖像的顯示 2.4總結 第3章分子動力學模擬的GPU並行實現 3.1建立適合GPU計算的分子動力學模擬算法 3.1.1分子動力學模擬簡介 3.1.2單個GPU上的算法 3.1.3多個GPU並行算法 3.1.4多相分子動力學的GPU...
《基於GPU性能模型的異構系統最佳化技術研究》是依託中國人民解放軍國防科技大學,由楊燦群擔任項目負責人的面上項目。中文摘要 基於GPU的異構系統已成為構建大規模並行計算機系統的有效途徑之一。這種體系結構對程式性能最佳化研究提出新的挑戰,...
本項目從算法的設計與分析的角度入手(如線上原始-對偶法,隨機算法等),在不改變硬體結構和作業系統的前提下,抽象出基於多核計算系統中的並行任務調度數學模型,並利用組合最佳化和算法設計的相關理論知識來設計高效的算法,並給出算法的...
(3)在原型系統上設計並實現了面向GPU的模式運算元(包括切線性模式、伴隨模式)中的核心算法(包括Fourier變換和Legendre變換)的並行最佳化;(4)對物理過程參數化方案(長波輻射方案RRTM_LW)進行GPU加速;(5)實現了海量觀測資料的並行...
並行最佳化 並行最佳化,利用多CPU和多加速器來最佳化應用程式的處理。利用多CPU和多加速器來最佳化應用程式的處理。
通過實驗驗證了所設計的並行運算最佳化算法能更有效提高大規模數據並行處理的工作效率,除此之外,設計了適用於大規模數據高可靠性處理的動態實時容錯機制,並通過系統實驗驗證了此容錯機制能有效地進行GPU集群下大規模數據處理時故障的檢 ...
為解決高階MoM計算能力受計算機記憶體限制的難題,本項目設計了基於CPU的高階MoM並行核外策略。為進一步提高算法的求解效率和計算能力,本項目研究了基於GPU的並行核外求解技術,採用異步通信技術與cuda流技術實現了兩級核外的通信最佳化,建立...
提出了兩層GPU並行算法,區塊內基於CUDA編程模型的細粒度數據並行算法以及區塊間基於GPU流處理的粗粒度任務並行算法。針對複雜外形多區格線模擬的特點,提出了kernel分解、分組多流等多種GPU性能最佳化方法。提出了基於嵌套OpenMP的多核CPU與GPU...
6.2 並行程式的最佳化 93 6.2.1 臨界區實現 93 6.2.2 原子操作實現 95 6.2.3 歸約實現 95 6.3 快速排序並行算法 96 第三篇 MPI並行程式設計 第7章 MPI編程基礎 103 7.1 MPI簡介 103 7.1.1 MPI的含義 103 7.1.2...
(3)節點內多CPU多GPU並行可視化算法存儲最佳化與任務調度算法;(4)節點內多CPU多GPU協同混合加速並行繪製算法;(5)GPU集群環境下,面向海量數據可視化套用的並行繪製算法;(6)面向多CPU多GPU並行算法設計平台與並行繪製平台。
3.4.6 柵格DEM生成等高錢並行算法實驗與測試 58 3.4.7 柵格DEM生成等高線並行算法的進一步最佳化 61 3.5 基於Windows集群的MPI並行處理方法 66 3.5.1 Windows集群搭建與配直 67 3.5.2 基於Windows集群的並行算法設計與實現 67 3...
1.5 空間疊加分析算法及其發展 13 1.5.1 空間分析 13 1.5.2 疊加分析 15 1.6 本章小結 20 參考文獻 20 第2 章 並行算法設計與最佳化理論 24 2.1 並行化策略 24 2.2 數據分解方法 26 2.2.1 序列劃分 27 2.2.2 ...
TMS320C6700系列DSP程式最佳化技術研究 一種基於CUDA的並行排序算法設計與實現 X處理器指控最佳化技術 DSP中對數壓擴算法的設計與實現 X-DSP中GPIO部件的邏輯設計與實現 YHFT-DX指令派發部件的全定製設計與最佳化 CPU-GPU異構系統上套用映射的若干...