NVIDIA Hopper 架構

產品介紹

基於 Hopper 架構的 GPU — NVIDIA H100

該款 GPU 集成了 800 億個電晶體。H100擁有 Transformer 引擎和高度可擴展的 NVIDIA NVLink® 互連技術等突破性功能，可推動AI 語言模型、深度推薦系統、基因組學和複雜數字孿生的發展。

H100利用大規模 AI 模型實現了實時沉浸式套用。H100 將支持聊天機器人使用monolithic Transformer 語言模型 Megatron 530B，吞吐量比上一代產品高出 30 倍，同時滿足實時對話式 AI 所需的次秒級延遲。利用 H100，研究人員和開發者能夠訓練龐大的模型，如包含 3950 億個參數的混合專家模型，訓練速度加速高達9倍，將訓練時間從幾周縮短到幾天。

H100為加速大規模AI和HPC設定了新的標準，帶來了六項創新：

晶片 —— H100 由 800 億個電晶體構建而成，這些電晶體採用了專為 NVIDIA 加速計算需求設計的TSMC 4N工藝，因而能夠提升 AI、HPC、顯存頻寬、互連和通信的速度，並能夠實現近 5TB/s 的外部互聯頻寬。H100 是首款支持 PCIe 5.0 的 GPU，也是首款採用 HBM3 的 GPU，可實現 3TB/s 的顯存頻寬。20個 H100 GPU 便可承托相當於全球網際網路的流量，使其能夠幫助客戶推出先進的推薦系統以及實時運行數據推理的大型語言模型。

Transformer 引擎 —— Transformer已成為自然語言處理的標準模型方案，也是深度學習模型領域最重要的模型之一。H100 加速器的 Transformer 引擎旨在不影響精度的情況下，將這些網路的速度提升至上一代的六倍。

第二代安全多實例 GPU —— MIG技術支持將單個 GPU 分為七個更小且完全獨立的實例，以處理不同類型的作業。與上一代產品相比，在雲環境中 Hopper 架構通過為每個 GPU 實例提供安全的多租戶配置，將 MIG 的部分能力擴展了 7 倍。

機密計算 —— H100是具有機密計算功能的加速器，可保護 AI 模型和正在處理的客戶數據。客戶還可以將機密計算套用於醫療健康和金融服務等隱私敏感型行業的聯邦學習，也可以套用於共享雲基礎設施。

第 4 代 NVIDIA NVLink —— 為加速大型 AI 模型，NVLink 結合全新的外接 NVLink Switch，可將 NVLink 擴展為伺服器間的網際網路，最多可以連線多達 256 個 H100 GPU，相較於上一代採用 NVIDIA HDR Quantum InfiniBand網路，頻寬高出9倍。

DPX 指令 —— 新的 DPX 指令可加速動態規劃，適用於包括路徑最佳化和基因組學在內的一系列算法，與 CPU 和上一代 GPU 相比，其速度提升分別可達 40 倍和 7 倍。Floyd-Warshall 算法與 Smith-Waterman 算法也在其加速之列，前者可以在動態倉庫環境中為自主機器人車隊尋找最優線路，而後者可用於 DNA 和蛋白質分類與摺疊的序列比對。

NVIDIA Hopper 架構

基本介紹

產品介紹

投產時間

相關詞條

熱門詞條