《四維變分同化CPU/GPU協同並行計算研究》是依託中國人民解放軍國防科技大學,由朱小謙擔任項目負責人的面上項目。
基本介紹
- 中文名:四維變分同化CPU/GPU協同並行計算研究
- 項目類別:面上項目
- 項目負責人:朱小謙
- 依託單位:中國人民解放軍國防科技大學
中文摘要,結題摘要,
中文摘要
四維變分同化是當前數值天氣預報領域極有價值的資料同化方法,對於提高中期數值天氣預報效果起到了關鍵作用,但是其巨大的計算量是制約技術發展和業務化的重要因素,開展四維變分同化並行算法研究具有重大學術價值和實際套用需求。當前基於CPU和GPU相結合的新型混合異構體系結構是構建千萬億次高性能計算機的有效途徑,同時也對四維變分同化並行算法研究提出了新的挑戰。本項目在已有工作的基礎上,面向千萬億次異構混合體系結構計算平台研究四維變分同化並行計算關鍵技術。在四維變分同化核心算法的細粒度並行、CPU與GPU協同並行計算、海量觀測資料GPU加速處理算法、GPGPU程式最佳化和面向千萬億次系統的大規模無約束最最佳化算法等方面開展研究,實現四維變分同化CPU/GPU異構協同高效並行計算,從而滿足業務預報時效性要求,推動數值天氣預報水平不斷提高。
結題摘要
本項目面向千萬億次高性能計算機系統,針對新型異構混合體系結構特點,開展數值天氣預報領域四維變分同化CPU/GPU協同並行算法關鍵技術研究,在以下幾個方面取得進展:(1)在國家超級計算天津中心的業務主機“天河一號”上構建了支持多種編程模型的YH4DVAR-GPU原型系統;(2)深入研究了WRF-GPU項目,將其移植到原型系統上進行了試驗和性能分析,掌握了數值天氣預報領域面向大規模CPU/GPU異構系統的並行計算技術和並行程式開發最佳化方法;(3)在原型系統上設計並實現了面向GPU的模式運算元(包括切線性模式、伴隨模式)中的核心算法(包括Fourier變換和Legendre變換)的並行最佳化;(4)對物理過程參數化方案(長波輻射方案RRTM_LW)進行GPU加速;(5)實現了海量觀測資料的並行處理;(6)在L-BFGS方法基礎上設計了GC-LBFGS方法,在每若干個疊代步之前插入共軛梯度疊代步,調整下一個疊代步的初始值的疊代時預條件,加快了目標函式值的下降速度從而提高了整個計算過程的收斂速度,針對疊代計算模組進行了GPU實現和最佳化,通過提高硬體利用率、訪存最佳化和通信最佳化等方法縮短了每個疊代步的計算時間。項目研究表明,通過CPU和GPU協同計算,可以完成更複雜物理模型計算,提高空間精度和時間尺度,最終得到更高質量的分析場,從而提高預報準確率和整體預報水平。