NVIDIA DGX SuperPOD是NVIDIA 於2024 年3月GTC大會上發布了基於全新Blackwell 架構的新一代 AI 超級計算機。NVIDIA DGX SuperPOD 可基於NVIDIA DGX GB200 系統或 NVIDIA DGX B200 系統構建而成。
產品配置
- 採用 DGX GB200 系統構建而成的 NVIDIA DGX SuperPOD
- 面向生成式 AI 時代的全新機架級擴展的 DGX SuperPOD 架構。全新 DGX SuperPOD 採用了統一的計算網路,包括第五代 NVIDIA NVLink 網路、NVIDIA BlueField®-3 DPU、NVIDIA Quantum-X800 InfiniBand 網路。這個架構可為計算平台中的每塊 GPU 提供高達每秒 1800 GB 的頻寬。此外,第四代 NVIDIA 可擴展分層聚合和規約協定(SHARP)™技術可提供 14.4 teraflops 的網路計算能力,網路計算能力與上一代產品相比提高了 4 倍。
- 統包式架構搭配先進的軟體,可實現前所未有的正常運行時間。全新 DGX SuperPOD 是一台完整的數據中心級 AI 超級計算機,在與 NVIDIA 認證合作夥伴提供的高性能存儲集成後,能夠滿足生成式 AI 工作負載的需求。每台超級計算機都在出廠前完成了搭建、布線和測試,從而大大加快了在用戶數據中心的部署速度。具有智慧型預測管理功能,能夠持續監控軟硬體中的數千個數據點,通過預測並攔截導致停機和低效的根源以節省時間、能耗和計算成本。
- 採用 NVIDIA DGX B200 構建 的 NVIDIA DGX SuperPOD
軟體和服務
- 所有 NVIDIA DGX 平台均包含用於企業級開發和部署的 NVIDIA AI Enterprise 軟體。DGX 用戶可以通過使用該軟體平台中的預訓練的 NVIDIA 基礎模型、框架、工具套件和全新 NVIDIA NIM 微服務來加速他們的工作。
- NVIDIA DGX 專家與部分獲得 NVIDIA DGX 平台支持認證的合作夥伴將在每個部署環節為用戶提供幫助,以便其迅速實現 AI 投產。在系統投入運行後,DGX 專家還將繼續協助用戶最佳化其 AI 管線和基礎設施。