面向混合體系結構的先進並行算法研究

面向混合體系結構的先進並行算法研究

《面向混合體系結構的先進並行算法研究》是依託中國人民解放軍國防科技大學,由劉傑擔任項目負責人的面上項目。

基本介紹

  • 中文名:面向混合體系結構的先進並行算法研究
  • 項目類別:面上項目
  • 項目負責人:劉傑
  • 依託單位:中國人民解放軍國防科技大學
中文摘要,結題摘要,

中文摘要

採用商用通用微處理器與定製加速計算協處理器相結合的混合體系結構成為構造千萬億次計算機系統的一種可行途徑,這種體系結構對大規模並行算法研究提出新的挑戰,需要深入研究與混合計算機體系結構相適應的先進並行算法。.本項目結合千萬億次異構混合體系結構高性能計算機系統的特點,研究與混合計算機體系結構相適應的先進並行算法,從系統的結點間、結點內和加速處理機間各個層次來開發核心基礎算法和典型套用問題的並行性,研製預條件Krylov子空間方法的新型並行算法、粒子輸運與粒子模擬典型套用問題的先進混合併行算法和針對協處理器的細粒度並行算法,設計開放式的偏微分方程混合併行計算支撐框架,實現高效能計算。

結題摘要

面向千萬億次混合高性能計算機系統,深入研究與體系結構相適應的先進並行算法,提出了7個核心算法的先進並行算法,研製了3個典型套用混合併行計算軟體。7個先進並行算法包括:接收驅動優先權計算方法、基於局部深度優先的優先權排序算法、稀疏矩陣向量乘GPU加速算法、基於循環拆分的中子輸運GPU加速算法、基於GPU的粒子輸運二維確定性非結構化格線數據級並行掃描算法、隨機數生成GPU加速算法和矩陣乘在多核多線FT1000微處理器上的並行算法,為典型套用問題的大規模混合併行計算提供了支撐。在典型套用混合併行計算軟體研製方面,提出了接收驅動自適應計算粒度並行流水線Sn掃描算法,研製了MPI/OpenMP混合非結構格線上多群中子輸運大型並行程式,針對空間格線點採用區域分解劃分,計算結點間基於訊息傳遞MPI編程,每個MPI計算進程在計算過程中碰到關於能群的計算,就生成多個OpenMP執行緒,計算結點內針對能群進行多執行緒並行計算。數值測試結果表明,非結構格線上的粒子輸運問題的混合併行計算能較好地匹配多核機群系統的硬體結構,具有良好的可擴展性,在千萬億次天河-1A上擴展到16384個CPU核。提出了求解非平衡動力學方程的並行算法,將數據進行分散式劃分,設計了一種負載平衡方法,為了增加數據局部性提出了一種多機串列計算方法,研製了非平衡動力學方程並行應用程式,具有良好的可擴展性,在千萬億次天河-1A上擴展到32768個CPU核。提出了深穿透粒子輸運MC模擬CPU/GPU協同並行算法,結合隨機數生成GPU加速算法,研製了非確定性粒子輸運MC模擬CPU/GPU大型並行程式,數值測試結果表明,MC粒子輸運問題的CPU/GPU混合併行計算具有良好的可擴展性,在千萬億次天河-1A上擴展到4096個CPU/GPU結點,共106496個核。對混合併行計算支撐框架研究進行了初步探索,初步形成面向異構體系結構的粒子輸運可擴展並行框架。上述結果驗證了深入研究與混合計算機體系結構相適應的先進並行算法的必要性,為典型套用問題的高性能計算提供了一條新的途徑。

相關詞條

熱門詞條

聯絡我們