NVIDIA Grace CPU

技術特性：

Grace是高度專業化的處理器，工作負載面向例如訓練具有超過1萬億個參數的新一代NLP模型等。當與NVIDIA GPU緊密耦合時，搭載Grace CPU的系統速度比如今基於NVIDIA DGX打造的最先進的系統（在 x86 CPU 上運行）快10倍。

Grace的強大性能基於第四代 NVIDIA NVLink互聯技術，該技術在Grace和 NVIDIA GPU 之間提供創紀錄的 900 GB/s 連線速度，使總頻寬比當今領先的伺服器高 30 倍。

Grace將利用創新的LPDDR5x記憶體子系統，該子系統的頻寬是 DDR4 記憶體的兩倍，能效達 DDR4 的 10 倍。此外，新架構提供單一記憶體地址空間的快取一致性，將系統和 HBM GPU 記憶體相結合，以簡化可程式性。

Grace將獲得 NVIDIA HPC軟體開發套件以及全套 CUDA和 CUDA-X庫的支持，可以對 2,000 多個 GPU 應用程式加速，使得應對全球重大挑戰的科學家和研究人員探索速度更快。

套用：

NVIDIA Grace CPU 是超過10,000個工程年的成果，專為滿足全球最先進套用的計算要求而設計—— 這些套用包括自然語言處理、推薦系統、AI 超級計算 —— 其所進行的數據分析需要超高速計算性能和大容量記憶體。這款產品將高能效Arm CPU 核心與低功耗記憶體子系統相結合，以高能效提供高性能。

Grace CPU 超級晶片

NVIDIA 於2022年3月推出首款面向 AI 基礎設施和高性能計算的基於 Arm Neoverse的數據中心專屬 CPU——NVIDIA Grace CPU 超級晶片。它由兩個 CPU 晶片組成，它們之間通過NVLink®-C2C互連在一起。NVLink®-C2C 是一種新型的高速、低延遲、晶片到晶片的互連技術。

技術特性

Grace CPU 超級晶片專為提供最高的性能而打造，能夠在單個插座（socket）中容納 144 個 Arm 核心，在 SPECrate®2017_int_base 基準測試中的模擬性能達到業界領先的 740 分。根據 NVIDIA 實驗室使用同類編譯器估算，這一結果較當前 DGX A100 搭載的雙 CPU 相比高 1.5 倍以上。
Grace CPU 超級晶片還提供業界領先的能效和記憶體頻寬，其依託帶有糾錯碼的LPDDR5x 記憶體組成的創新的記憶體子系統，可實現速度和功耗的最佳平衡。LPDDR5x 記憶體子系統提供兩倍於傳統DDR5設計的頻寬，可達到每秒1 TB ，同時功耗也大幅降低，CPU加記憶體整體功耗僅500瓦。
Grace CPU 超級晶片基於最新的數據中心架構 Arm®v9，具備最高的單執行緒核心性能，並支持 Arm 新一代矢量擴展，其將為諸多套用帶來直接收益。
Grace CPU 超級晶片可以運行所有的 NVIDIA 計算軟體棧，包括 NVIDIA RTX™、NVIDIA HPC、NVIDIA AI 和 Omniverse。Grace CPU 超級晶片結合 NVIDIA ConnectX®-7 網卡，能夠靈活地配置到伺服器中 —— 或作為獨立的純 CPU 系統，或作為 GPU 加速伺服器，搭載一塊、兩塊、四塊或八塊基於Hopper 的 GPU ，從而使客戶通過只維護一套軟體棧就能針對自身特定的工作負載做好性能最佳化。

NVIDIA Grace CPU

基本介紹

相關詞條

熱門詞條