NVIDIA DGX GH200是NVIDIA於2023年5月29日宣布推出新型大記憶體AI超級計算機。由NVIDIA GH200 Grace Hopper超級晶片和NVIDIA NVLink Switch System 驅動,旨在助力開發面向生成式AI語言套用、推薦系統和數據分析工作負載的下一代巨型模型。
主要功能,合作夥伴,
主要功能
NVIDIA DGX GH200的超大共享記憶體空間通過NVLink互連技術以及NVLink Switch System使256個GH200超級晶片相連,使它們能夠作為單個GPU運行。其提供1 exaflop的性能和144 TB的共享記憶體——相較2020年推出的上一代NVIDIA DGX A100記憶體大了近500倍。
GH200超級晶片使用NVIDIA NVLink-C2C晶片互連,將基於Arm的NVIDIA Grace CPU與NVIDIA H100 Tensor Core GPU整合在一起,從而不再需要傳統的CPU至GPU PCIe連線。與PCIe技術相比,這將GPU和CPU之間的頻寬提高了7倍,將互連功耗減少了5倍以上,並為DGX GH200超級計算機提供了一個600GB的Hopper架構GPU構建模組。
DGX GH200是第一款將Grace Hopper超級晶片與NVIDIA NVLink Switch System配對使用的超級計算機,這種新的互連方式使DGX GH200系統中的所有GPU作為一個整體協同運行。
DGX GH200架構相比上一代將NVLink頻寬提升了48倍以上,實現在單個GPU上通過簡單編程即可提供大型AI超級計算機的能力。
合作夥伴
谷歌雲、Meta和微軟是首批有望接入DGX GH200來探索其用於生成式AI工作負載的能力的公司。