NVIDIA Nemotron-3 8B 模型是NVIDIA發布的系列模型工具,可用於為企業構建生產就緒生成式 AI 套用,從而推動從客服 AI 聊天機器人到尖端 AI 產品的各種創新。這些新的基礎模型現已加入 NVIDIA NeMo。
簡介,特性,模型種類,
簡介
這個端到端框架用於構建、自定義和部署專為企業定製的 LLM。企業可以使用這些工具快速高效地大規模開發 AI 套用。這些套用可在雲端、數據中心以及 Windows PC 和筆記本電腦上運行。
Nemotron-3 8B 系列現已在 Azure AI Model 目錄、HuggingFace 和 NVIDIA NGC 目錄上的 NVIDIA AI Foundation Model 中心提供。該系列包含基本模型、聊天模型和問答(Q&A)模型,可解決各種下游任務。
特性
多語言功能是 Nemotron-3 8B 系列模型的關鍵優勢之一。這些開箱即用的模型精通 50 多種語言,包括英語、德語、俄語、西班牙語、法語、日語、中文、韓語、義大利語和荷蘭語。
模型種類
1. 基本模型 Nemotron-3-8B-Base:支持自定義,包括高效參數微調和對領域適應 LLM 的持續預訓練。
2. 聊天模型 Nemotron-3-8B-Chat-SFT:用於指令調優自定義模型或用戶定義一致性的構建模組,如 RLHF 或 SteerLM 模型。
3. 聊天模型 Nemotron-3-8B-Chat-RLHF:開箱即用的最佳聊天模型性能。
4. 聊天模型 Nemotron-3-8B-Chat-SteerLM:開箱即用的最佳聊天模型,支持在推理時靈活調整。
5. 問答模型 Nemotron-3-8B-QA:基於知識庫自定義的問答 LLM。