Press "Enter" to skip to content

“NVIDIA 加速为企业定制生成型人工智能模型的开发”

如今,免费的开源大型语言模型(LLMs)的景象就像是一家任君选择的自助餐厅,满足企业的需求。对于开发者来说,这种丰富多样可能会让他们在构建定制的生成型人工智能应用程序时感到不知所措,因为他们需要满足独特的项目和业务需求,包括兼容性、安全性以及用于训练模型的数据。

NVIDIA AI Foundation Models 是一系列精心策划的企业级预训练模型,为开发者在企业应用中引入定制的生成型人工智能提供了快速的起步。

NVIDIA 优化的基础模型加速创新

NVIDIA AI Foundation Models 可以通过简单的用户界面或 API 直接从浏览器进行体验。此外,这些模型可以通过 NVIDIA AI Foundation Endpoints 进行访问,以便在企业应用中测试模型的性能。

可用的模型包括领先的社区模型,如 Llama 2、Stable Diffusion XL 和 Mistral,这些模型经过格式化,以帮助开发者使用专有数据来简化定制。此外,这些模型还经过了优化,使用 NVIDIA TensorRT-LLM 来提供最高吞吐量和最低延迟,并在任何 NVIDIA GPU 加速堆栈上扩展运行。例如,使用 TensorRT-LLM 优化的 Llama 2 模型在 NVIDIA H100 上运行速度几乎是 2 倍快

新的 NVIDIA Nemotron-3 8B 基础模型 支持创建当今最先进的企业聊天和问答应用程序,适用于包括医疗保健、电信和金融服务在内的广泛行业。

这些模型为客户构建安全、可投产的生成型人工智能应用程序提供了一个起点。它们是在负责任的数据集上训练的,并且在性能上与更大的模型相当。这使它们非常适合企业部署。

多语言能力是 Nemotron-3 8B 模型的一个重要特点。模型默认支持超过 50 种语言,包括英语、德语、俄语、西班牙语、法语、日语、中文、韩语、意大利语和荷兰语。

快速定制部署

企业在业务功能中利用生成型人工智能需要一个 AI 铸造厂为其独特的应用程序定制模型。NVIDIA 的 AI 铸造厂包括三个元素:NVIDIA AI Foundation Models、NVIDIA NeMo 框架和工具,以及 NVIDIA DGX Cloud AI 超级计算服务。这些元素共同为创建定制的生成型人工智能模型提供了一站式企业解决方案。

重要的是,企业拥有其定制的模型,并且可以在具备企业级安全性、稳定性和支持的加速计算环境中几乎无处不部署,使用 NVIDIA AI Enterprise 软件。

NVIDIA AI Foundation Models 可以免费在 NVIDIA NGC 目录和 Hugging Face 上进行实验,也可以在 Microsoft Azure AI 模型目录中托管。

Leave a Reply

Your email address will not be published. Required fields are marked *