基於NIC的Exascale級計算機聚合通信卸載關鍵技術研究

基於NIC的Exascale級計算機聚合通信卸載關鍵技術研究

《基於NIC的Exascale級計算機聚合通信卸載關鍵技術研究》是依託中國人民解放軍國防科技大學,由王紹剛擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於NIC的Exascale級計算機聚合通信卸載關鍵技術研究
  • 項目類別:青年科學基金項目
  • 項目負責人:王紹剛
  • 依託單位:中國人民解放軍國防科技大學
中文摘要,結題摘要,

中文摘要

基於網路接口控制器(NIC)的聚合通信卸載技術是解決並行應用程式通信瓶頸的重要途徑,在Exascale級計算機系統背景下,下一代基於NIC的聚合通信卸載技術面臨著眾核處理器、系統規模爆炸性增長、網際網路複雜等方面的挑戰,迫切需要開展NIC新體系結構的研究。本課題擬提出新的聚合通信卸載軟硬體構架,通過軟體生成算法框架,硬體提供可程式原語支持的技術途徑,降低硬體實現的複雜度,並解決有效支持眾核處理器、上十萬個節點的可擴展性需求等問題。課題還擬在新的架構下,研究支持網際網路拓撲、非阻塞、近鄰模式等聚合通信新特性的關鍵技術。本課題進行的研究著眼於突破軟硬體接口、算法框架提取、硬體原語設計、NIC體系結構等一系列關鍵問題,將為下一代高性能計算機NIC的設計實現提供有效的理論和技術支持。

結題摘要

在Exascale級計算機系統背景下,下一代基於NIC的聚合通信卸載技術面臨著眾核處理器、系統規模爆炸性增長、網際網路複雜等方面的挑戰,迫切需要開展NIC新體系結構的研究。本課題擬提出新的聚合通信卸載軟硬體構架,通過軟體生成算法框架,硬體提供可程式原語支持的技術途徑,降低硬體實現的複雜度,並解決有效支持眾核處理器、上十萬個節點的可擴展性需求等問題。課題還擬在新的架構下,研究支持網際網路拓撲、非阻塞、近鄰模式等聚合通信新特性的關鍵技術。本課題進行的研究著眼於突破軟硬體接口、算法框架提取、硬體原語設計、NIC體系結構等一系列關鍵問題,將為下一代高性能計算機NIC的設計實現提供有效的理論和技術支持。 本課題的基本思想正是要設計一種新的基於NIC的聚合通信卸載架構,依據軟硬體協同的思路解決下一代並行計算機系統所面臨的規模爆炸問題。通過定義新的軟硬體接口來描述聚合通信的算法執行框架,實現合理的軟硬體分工。軟體根據硬體提供的原語將聚合通信的算法框架描述出來,並提交給硬體,但不參與實際的通信和同步。硬體提供基本的原語支持,可實現按照軟體計算好的算法框架執行聚合通信算法,只完成通信和同步的操作。硬體基本原語單元的設計實現簡單,能夠在NIC中實現多個,以此實現與眾核處理器核數匹配的聚合通信卸載能力,解決單NIC對MPI多執行緒聚合通信支持不足的問題。 此外,本課題還進行了大數據量的遠程記憶體訪問(RDMA)傳輸的研究,針對系統的容錯性設計面臨著很大的挑戰,互連網路具有鏈路不可靠、自適應路由等特點,如何面向不可靠網路實現可靠的端到端RDMA傳輸是並行系統體系結構設計的一大難題。提出一種面向不可靠網路下的快速RDMA傳輸方法,方法能夠在節點控制器晶片上高效實現,對上層驅動軟體和套用提供可靠的端到端RDMA傳輸服務。 通過3年的課題研究,課題收穫了較好的研究成果。本課題主要提出了若干在E計算環境下使用的聚合通信卸載方案,通過課題的多方合作研究,實現了在可靠實驗平台上的驗證。在天河並行計算機的驗證環境中,有效驗證了方案的可行性。在學術研究成果方面,課題獲得了豐碩的成果,共發表了高水平學術論文7篇(均為EI索引),並在ISC等國際高水平學術會議上進行了成果展示;申請了一項國家發明專利,目前已經獲得正式授權。此外,項目負責人獲得軍隊科技進步獎一項。

相關詞條

熱門詞條

聯絡我們