《大規模非對稱可重構流計算理論與技術研究》是依託中國人民解放軍國防科技大學,由文梅擔任項目負責人的面上項目。
基本介紹
- 中文名:大規模非對稱可重構流計算理論與技術研究
- 項目類別:面上項目
- 項目負責人:文梅
- 依託單位:中國人民解放軍國防科技大學
中文摘要,結題摘要,
中文摘要
在眾多高效能計算需求領域,可重構技術以其極為卓越的性能而被寄予厚望,成為超越傳統計算架構的重要手段。然而,隨著可重構系統資源大規模化、異構化的發展趨勢,一些關鍵基礎問題,例如大規模可重構系統計算模型、體系結構一體化設計及管理、非對稱性難題等等,極大限制了可重構計算的發展和套用。新興的流計算模型以存儲與計算解耦合、計算密集化、數據規則化和高預知性等特點,為可重構計算的發展提供了新的思路。本課題對流計算模型進行創新並引入到可重構計算中,首次提出大規模非對稱可重構流計算理論與技術研究,引入了多態可重構計算模型和與之相匹配的可重構流體系結構模板,並基於共有模型和模板對可重構系統進行軟硬體協同管理,支持面向套用快速構建和最佳化可重構平台,提高可重構系統實際計算效能。該項研究具有原創性,對我國發展面向大規模數位訊號處理、科學模擬以及其它特殊領域的高效能計算平台具有重要意義。
結題摘要
本項目研究以面向未來納米級VLSI時代的大規模可重構計算系統為目標,課題進展的四年間,課題組對以下內容進行了深入的研究,圓滿完成了研究目標: (1) 面向大規模套用的可重構流體系結構計算模型與編程模型研究。 可重構流體系結構計算模型和編程模型的是一個互相促進、螺旋式上升的設計過程。為滿足高性能、高能效、高可靠、高實時需求和高的可擴展性,我們選用了cluster on chip的並行計算模型。我們希望借鑑巨型機的並行編程模式,因此我們基於天河1A,天河-2超級計算機,對peta級的套用進行了以並行編程最佳化為主的研究,對MPI,OpenMP,CUDA,OpenCL等並行編程以及混合編程模型有了深入的理解。在此基礎上,提出面向非對稱流體系結構的OpenCL+細粒度MPI並行計算模型和編程框架。 (2) 層次化的可重構流體系結構模板及軟硬體協同的非對稱流控管理最佳化技術。 基於統一的流編程環境,我們提出了統一的流體系結構模板。頂層視圖由大量可重構運算簇、少量標量核和片上路由組成。每個標量核上運行一個runtime,用來管理各個運算簇;每個運算簇都可以作為標量核的一個設備運行,用於對目標套用的加速;片上網路為標量核和運算簇之間的數據、通信提供實際的物理通道。整個系統的外部存儲和IO也通過標量核來控制。結合具體機器視覺套用進行套用領域、並行算法等研究,基於統一的流體系結構模板,結合軟硬體協同的非對稱流控管理最佳化技術,我們設計出面向現代深度卷積神經網路(CNN)圖像分類套用的加速計算核,以及對應片上存儲層次等關鍵模組。實驗結果表明基於可重構流體系結構模板設計的加速器在性能、功耗、面積等指標上都取得了良好的結果。 (3) 原型系統及工具鏈的構建。 面向套用的體系結構設計能夠大幅提高處理器的能效比,基於cluster on chip的計算模型,我們提出了基於可程式加速器的大規模異構片上集群結構。我們設計了配套原型系統以及工具鏈,對核心處理器體系結構的基本主鍵件、全系統性能等進行了充分的驗證。 研究形成了一批有價值的創新成果,取得良好的國際國內學術影響。其中發表文章19篇,其中SCI檢索10篇,EI檢索8篇,出版專著1部,申請專利3項,培養研究生32名。