面向高性能異構眾核架構的大規模CFD並行算法與套用

面向高性能異構眾核架構的大規模CFD並行算法與套用

《面向高性能異構眾核架構的大規模CFD並行算法與套用》是依託中國人民解放軍國防科技大學,由徐傳福擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:面向高性能異構眾核架構的大規模CFD並行算法與套用
  • 項目類別:青年科學基金項目
  • 項目負責人:徐傳福
  • 依託單位:中國人民解放軍國防科技大學
中文摘要,結題摘要,

中文摘要

高性能異構眾核架構的出現和發展給大規模CFD套用數值模擬提供了前所未有的機遇,也帶來了前所未有的挑戰。傳統CPU平台上的CFD並行計算方法無法適應異構眾核這一新型並行架構特點,迫切需要從CFD數值模擬的數值模型和算法特點出發,緊密結合異構架構特徵,針對性地開展並行計算研究,使應用程式充分發掘大規模異構眾核高性能計算機性能。本項目面向多區格線CFD套用選擇典型顯式、隱式求解方法,結合GPU/MIC等主流高性能異構眾核平台體系結構和編程模型特點,研究CFD求解方法的多層次可擴展眾核並行算法,發展CFD套用和眾核體系結構特徵相融合的性能最佳化方法,突破異構眾核高效協同並行CFD計算一系列關鍵理論、技術,並將研究成果套用於自主智慧財產權CFD程式在國產異構眾核超級計算機上的異構並行實現,以提升CFD數值模擬能力,滿足CFD套用發展需求。

結題摘要

本項目主要研究CFD眾核可擴展並行算法、異構協同並行方法以及性能最佳化方法等。項目針對目前CFD中套用最為廣泛的隱式LU-SGS求解方法,設計了基於兩級流水線的可擴展眾核並行算法,大幅降低了流水線並行計算數據依賴的影響,實現了MPI+OpenMP混合併行計算;針對高精度CFD,設計實現了高效新型預條件JFNK並行求解方法並進行了系統的參數調優,相對於傳統線性LU-SGS求解效率提升了一個量級。項目在天河二號超級計算機上,採用OpenMP4.X和Python兩種新型並行編程模型實現了3D LBM多相流的大規模CPU+MIC異構協同並行,設計了CPU與MIC加速器之間的負載均衡策略,通過異步方式最大程度地實現了計算和通信重疊,在天河二號超級計算機上成功模擬了基於D3Q19離散方法和Shan-Chen BGK碰撞模型的氣液兩相流,算例規模百億格線,並行規模1024結點,並行效率超過90%。項目針對CFD中典型熱點計算模板開展了性能最佳化研究。結合WCNS高精度格式半節點重構模板特點與集成眾核平台的寬向量、高執行緒並發度等體系結構特徵, 開展以向量化為核心的性能最佳化研究,最佳化後的半節點重構計算在Xeon Phi上獲得了8倍的性能提升,單加速器的性能相當於雙路CPU的2.5倍。CFD控制方程離散後獲得的線性系統矩陣是稀疏的,通常CFD計算模板可以表示為稀疏矩陣向量乘的形式。項目針對國產新型眾核處理器FT-2000,開展了稀疏矩陣乘的性能分析和並行最佳化研究,與Intel多核處理器以及眾核處理器MIC進行了深入的對比,為後續基於國產眾核平台開展關鍵計算模板的最佳化和數據結構的改進奠定了基礎。

相關詞條

熱門詞條

聯絡我們