NVIDIA DGX B200是NVIDIA於2024年3月推出的一款統一用於AI模型訓練、微調和推理的通用AI超級計算平台系統。
簡介,性能,軟體和服務,套用,
簡介
採用風冷傳統機架式設計的 DGX 已被全球各行各業數千家企業廣泛採用,DGX B200 是 DGX 系列的第六代產品。採用 Blackwell 架構的全新 DGX B200 系統包含 8 個 NVIDIA B200 Tensor Core GPU 和 2 個第五代英特爾®至強®處理器。
性能
DGX B200 系統包含帶有 8 個 NVIDIA ConnectX™-7 網卡和 2 個 BlueField-3 DPU 的高性能網路,每個連線的頻寬高達 400 Gb/s,可通過 NVIDIA Quantum-2 InfiniBand 和 NVIDIA Spectrum™-X 乙太網網路平台支持更高的 AI 性能。
DGX B200 系統憑藉全新 Blackwell 架構中的 FP4 精度特性,可提供高達 144 petaflops 的 AI 性能、1.4TB 海量的 GPU 顯存和 64TB/s 的顯存頻寬,從而使得該系統的萬億參數模型實時推理速度比上一代產品提升了 15 倍。
軟體和服務
所有 NVIDIA DGX 平台均包含用於企業級開發和部署的 NVIDIA AI Enterprise 軟體。DGX 用戶可以通過使用該軟體平台中的預訓練的 NVIDIA 基礎模型、框架、工具套件和全新 NVIDIA NIM 微服務來加速他們的工作。
NVIDIA DGX 專家與部分獲得 NVIDIA DGX 平台支持認證的合作夥伴將在每個部署環節為用戶提供幫助,以便其迅速實現 AI 投產。在系統投入運行後,DGX 專家還將繼續協助用戶最佳化其 AI 管線和基礎設施。
套用
除了可單獨作為一台AI 超級計算機來使用,用戶還可以使用 DGX B200 系統構建 DGX SuperPOD,打造能夠幫助大型開發團隊運行多種不同作業的 AI 卓越中心。