NVIDIA Nemotron-3 8B 模型

簡介

這個端到端框架用於構建、自定義和部署專為企業定製的 LLM。企業可以使用這些工具快速高效地大規模開發 AI 套用。這些套用可在雲端、數據中心以及 Windows PC 和筆記本電腦上運行。

Nemotron-3 8B 系列現已在 Azure AI Model 目錄、HuggingFace 和 NVIDIA NGC 目錄上的 NVIDIA AI Foundation Model 中心提供。該系列包含基本模型、聊天模型和問答（Q&A）模型，可解決各種下游任務。

多語言功能是 Nemotron-3 8B 系列模型的關鍵優勢之一。這些開箱即用的模型精通 50 多種語言，包括英語、德語、俄語、西班牙語、法語、日語、中文、韓語、義大利語和荷蘭語。

1. 基本模型 Nemotron-3-8B-Base：支持自定義，包括高效參數微調和對領域適應 LLM 的持續預訓練。

2. 聊天模型 Nemotron-3-8B-Chat-SFT：用於指令調優自定義模型或用戶定義一致性的構建模組，如 RLHF 或 SteerLM 模型。

3. 聊天模型 Nemotron-3-8B-Chat-RLHF：開箱即用的最佳聊天模型性能。

4. 聊天模型 Nemotron-3-8B-Chat-SteerLＭ：開箱即用的最佳聊天模型，支持在推理時靈活調整。

5. 問答模型 Nemotron-3-8B-QA：基於知識庫自定義的問答 LLM。