《面向超高性能計算的眾執行緒寬向量微體系結構》是依託中國人民解放軍國防科技大學,由王永文擔任項目負責人的面上項目。
基本介紹
- 中文名:面向超高性能計算的眾執行緒寬向量微體系結構
- 項目類別:面上項目
- 項目負責人:王永文
- 依託單位:中國人民解放軍國防科技大學
中文摘要,結題摘要,
中文摘要
未來ExaFLOPS級超高性能計算已經對微處理器體系結構研究提出緊迫的需求。傳統通用處理器架構的性能提升空間有限,新型處理器架構往往因改變用戶編程習慣而難以迅速推廣。本項目基於向量和多執行緒編程模型,提出一種眾執行緒寬向量微體系結構,利用寬向量的數據並行提高峰值性能,利用眾執行緒的交叉執行提高實際性能。主要研究內容有:(1)面向高性能計算的寬向量指令集擴展,包括向量寬度的設計、向量暫存器擴展和向量操作指令擴展等。(2)眾執行緒寬向量執行模型,包括指令調度策略、向量執行部件設計、存儲系統設計和訪存調度策略,以及微體系結構設計空間探索等。(3)模擬器設計,支持快速功能模擬器和精確的多指標細節模擬,基於典型程式的模擬測試來驗證眾執行緒寬向量微體系結構的有效性。本項目的研究成果將為未來高性能計算做技術儲備,為傳統程式進一步提高性能提供硬體基礎,為提高國產CPU設計能力和實用性能貢獻力量。
結題摘要
未來超高性能計算對微處理器體系結構研究提出了緊迫的需求。傳統通用處理器架構的性能提升空間有限,新型處理器架構往往因改變用戶編程習慣而難以迅速推廣。本課題提出了一種MTV眾執行緒寬向量微體系結構,將SIMD模式的寬向量處理技術和眾執行緒技術相結合,通過向量處理技術獲得高峰值運算能力,通過眾執行緒技術隱藏長延遲操作,將峰值運算能力轉化為實用運算能力。 本課題的主要進展和成果如下: 1.定義了面向科學計算的通用SIMD向量指令擴展。基於基本的RISC指令集,面向超高性能計算套用需求特點,本課題提出了一套向量暫存器、向量指令擴展方案,並定義了指令操作類型與編碼、指令的中斷與異常、向量與標量的存儲模型等。 2.提出了結合眾執行緒與寬向量技術的MTV微體系結構。提出了多路分組交叉多執行緒的向量執行模式,並研究了指令發射調度、指令取指調度和訪存調度等多執行緒調度策略。 3.提出高頻寬向量數據批量載入機制。針對向量數據量大、指令吞吐率低的特點,提出一種批量數據載入機制,一次可以載入多個向量數據,大幅度提高了多執行緒向量數據載入的頻寬。 4.提出了MTV體系結構的矩陣乘性能分析理論模型。使用矩陣乘這一科學和工程套用的核心算法,構造了一個性能分析模型,並分析了MTV體系結構的性能。 5.開發了MTV體系結構模擬器。面向MTV微體系結構,設計實現了指令功能模擬器和性能模擬器,對MTV體系結構的概念進行驗證。並提出了一種CPADSE設計空間探索方法,加速了基於模擬器的性能分析研究。 6.實現了MTV體系結構的原型系統。基於通用FPGA開發板,實現了一種MTV的原型系統,該系統可以引導作業系統核心,並執行測試程式。該原型系統對MTV體系結構進行了更真實的驗證。 本課題發表論文33篇,申請專利8項,培養研究生8名。 本課題完成了計畫書中的全部研究內容,根據項目進展對研究內容進行擴充,並為軟硬體協同最佳化、設計空間探索加速、基於原型系統的測試驗證等工作開拓了新的起點。