《預算功率指導的高能效GPU集群任務調度模型與算法》是依託清華大學,由都志輝擔任項目負責人的面上項目。
基本介紹
- 中文名:預算功率指導的高能效GPU集群任務調度模型與算法
- 依託單位:清華大學
- 項目負責人:都志輝
- 項目類別:面上項目
項目摘要,結題摘要,
項目摘要
高能耗已經成為超級計算機研製與套用中必須解決的挑戰性問題。本研究針對GPU集群這種典型的超級計算機體系結構,旨在解決在GPU集群上實現高能效任務調度所面臨的基礎性核心問題,設計可以長期、大幅度降低超級計算機能耗的調度模型與算法。本研究分析並抽象典型GPU集群的系統模型、任務模型、能耗模型以及調度模型;提出一種可以度量與比較超級計算機能量效率水平的指標;設計出瀑布模型用於指導多層次、多粒度的節能策略開發,在充分考慮全局節能效果的基礎上給出預算功率的設定原則與方法,據此提出了基於預算功率指導的層次化、高能效任務調度算法的設計方法;基於仿真環境、原型系統以及真實系統,分別設計了對本研究提出的調度算法與相關策略的有效性進行全面驗證與進一步最佳化提高的方法。這項基礎性的研究成果,一方面可以用於指導未來節能型超級計算機的研製,另一方面可以套用到已經存在的超級計算系統中,大幅度降低其能耗開銷。
結題摘要
高能耗已經成為超級計算機研製與套用中必須解決的挑戰性問題,而且也成為雲中心首先考慮的核心問題。本研究針對GPU集群這種典型的超級計算機體系結構,解決在GPU集群上實現高能效任務調度所面臨的基礎性問題,設計可以長期、大幅度降低超級計算機能耗、最佳化執行性能的調度模型與算法。本研究分析並抽象典型GPU集群的系統模型、任務模型、能耗模型,據此提出相應的調度模型;結合GPU超級計算系統與雲中心,設計多層次、多粒度的節能策略,在充分考慮全局節能效果與套用執行性能的基礎上,提出基於預算功率指導的層次化、高能效任務調度算法的設計方法;基於仿真環境、原型系統以及大規模真實GPU集群系統,並結合引力波數據處理、雙黑洞仿真、空間天氣實時預報、網路仿真等科學與工程套用問題,對本研究提出的算法與相關策略的有效性進行了實現、驗證與提高,取得了顯著的套用成果。