NVIDIA AI Enterprise

NVIDIA AI Enterprise 是一个端到端的云原生软件平台,可加速数据科学流程,并简化生产级协同助手和其他生成式 AI 应用程序的开发和部署。 易于使用的微服务提供优化的模型性能,以及企业级的安全性、支持和稳定性,从而确保在企业将其业务运营在 AI 之上时,从原型到生产的平稳过渡。

AI 应用程序组件和开发工具

NVIDIA 的 NGC 目录提供了各种易于部署的微服务、预训练模型和其他软件包组件,这些组件专供 NVAIE 订阅者使用,并提供 NVIDIA 的支持保证。
易于使用的微服务,旨在加速企业中生成式 AI 的实施。 专供 NVIDIA AI Enterprise Essentials 订阅者使用,并由 NVIDIA 企业级支持团队提供支持。

活跃的基础架构发布分支

软件分支驱动程序分支分支中的最新驱动程序分支分支中的最新版本发布日期EOL 日期
AI Enterprise 5.xR550550.127.06特性和生产5.32025 年 1 月2025 年 4 月
AI Enterprise 4.xR535535.216.01长期支持4.52025 年 1 月2027 年 9 月

所有基础架构发布分支

软件分支驱动程序分支分支中的最新驱动程序分支分支中的最新版本发布日期EOL 日期
AI Enterprise 3.xR525525.147.05特性和生产3.32023 年 11 月2023 年 12 月
AI Enterprise 2.xR520520.61.05特性2.32022 年 10 月2022 年 11 月
AI Enterprise 1.xR470470.256.02长期支持1.92024 年 7 月2024 年 9 月

NVIDIA AI Enterprise 基础架构发布分支

NVIDIA AI Enterprise 基础架构版本 5.x 文档。
版本 5.3 是最新版本。
NVIDIA AI Enterprise 基础架构版本 4.x 文档。
版本 4.5 是最新版本。
NVIDIA AI Enterprise 版本 3.x 文档。
NVIDIA AI Enterprise 版本 2.x 文档。
NVIDIA AI Enterprise 版本 1.x 文档。

NVIDIA AI Enterprise 应用程序发布分支

生产分支 (PB) 包含生产就绪的 AI 框架和 SDK 分支,为构建关键任务 AI 应用程序提供 API 稳定性和安全环境。
特性分支 (FB) 提供最新版本的 NVIDIA 构建和 NVIDIA 优化的 AI 框架、NVIDIA NIM 微服务、预训练模型和 SDK,并提供对最新软件特性和优化的访问。
长期支持分支 (LTSB) 包含长期支持的 AI 框架和 SDK,为高度监管的行业提供 36 个月的 API 稳定性和安全环境。

NVIDIA AI Enterprise 支持生命周期策略

此企业软件生命周期反映了 NVIDIA AI Enterprise 的分发方式的变化,这些变化在 NVIDIA AI Enterprise 4.0 中引入。 从 NVIDIA AI Enterprise 4.0 开始,AI 框架和 SDK 与用于管理和优化基础架构和工作负载的软件解耦。
构建生成式 AI 聊天机器人,使用最新信息准确回答特定领域的查询。
缩短开发用于检测网络安全威胁的数字指纹解决方案的时间。
开发由大型语言模型驱动的 RAG 应用程序,从而实现更自然、个性化的购物体验。
路线优化工作流程演示了如何使用 NVIDIA cuOpt 通过为车队寻找最佳路线来最大限度地减少车辆路线低效问题,从而进行交付、取货、调度作业等。
本文档提供了在云中部署和运行 NVIDIA AI Enterprise 的指南。 此资源可用于了解系统先决条件、安装和配置。
本文档深入介绍了为 VMware vSphere 部署 NVIDIA AI Enterprise 的信息,并作为了解系统先决条件、安装和配置的技术资源。
本文档深入介绍了在裸机服务器上部署 NVIDIA AI Enterprise 的信息,并作为了解系统先决条件、安装和配置的技术资源。
本文档深入介绍了 NVIDIA AI Enterprise 的仅 CPU 部署,并作为了解系统先决条件、安装和配置的技术资源。
本文档深入介绍了在裸机服务器上使用 Red Hat OpenShift 部署 NVIDIA AI Enterprise 的信息。 此技术资源可用于了解系统先决条件、安装和配置。
本文档深入介绍了在 VMware vSphere 上使用 Red Hat OpenShift 部署 NVIDIA AI Enterprise 的信息。 此技术资源可用于了解系统先决条件、安装和配置。
本文档深入介绍了在带有 KVM 虚拟化的 Red Hat Enterprise Linux 上部署 NVIDIA AI Enterprise 的信息,并作为了解系统先决条件、安装和配置的技术资源。
NVIDIA RAPIDS Accelerator for Apache Spark 使数据工程师能够加速 Apache Spark 3 数据科学流程和 AI 模型训练,同时降低基础架构成本。
用于构建和部署 AI 解决方案作为微服务的 AI 工作流程打包组件。
本指南旨在提供有关如何将高性能多节点集群设置为虚拟机的指导。 在本指南中,您将熟悉 GPUDirect RDMA 和 ATS,同时使用 Docker 作为运行高性能多节点深度学习训练的平台。 ATS 是 vSphere 7 Update 2 中 VMware PCIe 支持增强功能。 GPUDirect RDMA 受益于 ATS,并已通过 NVIDIA AI Enterprise 的认证和支持。
本解决方案指南概述了通过利用自然语言处理用例示例在 NVIDIA AI Enterprise 上创建 AI 流程。
ClearML 提供了一种机器学习解决方案,可最大限度地提高资源利用率和可访问性,同时最大限度地减少 DevOps 工作负载。 它为持续 AI 提供了一个统一的开源平台。 本文档旨在为在 NVIDIA AI Enterprise 上利用 VMware vSphere Tanzu 集群部署 ClearML 平台提供经过验证的部署指南。
Domino Data Lab 的企业 MLOps 平台加速了研究,加快了模型部署,并提高了大规模代码优先数据科学团队的协作,所有这些都在一个平台上完成。 本文档介绍了为部署到 VMware vSphere 托管的 Kubernetes 集群并使用 VMware vSAN 存储的 NVIDIA AI Enterprise 提供的 Domino Data Lab 企业 MLOps 平台。
Run:ai 的 Atlas 平台使 IT 组织能够在任何基础设施上构建具有类似云的资源可访问性和管理功能的 AI 基础设施,并使研究人员能够使用他们选择的任何机器学习和数据科学工具。 本文档旨在为在 NVIDIA AI Enterprise 上利用 VMware vSphere Tanzu 集群部署 Run:ai Atlas 平台提供经过验证的部署指南。
UbiOps MLOps 平台是为正在寻找一种简单、灵活且生产就绪的方式来部署、训练和运行机器学习和数据科学代码的数据科学家和团队开发的。 它还可用于部署现成的 LLM 和 GenAI 模型,以及运行辅助函数和其他数据处理任务。 本文档旨在为利用 NVIDIA AI Enterprise 软件堆栈部署 UbiOps MLOps 平台提供经过验证的部署指南。
了解 HPE ML Data Management (MLDM) 的基础知识,以及如何在 Kubernetes 集群中安装该平台。
通过帮助工程师和数据科学家协作、构建更准确的 ML 模型并更快地训练它们,从您的数据中发现隐藏的见解。
本文档提供了使用 NVIDIA GPU Operator 安装 Charmed Kubernetes 的综合指南,从而为运行 NVIDIA AI Enterprise 软件提供了理想的平台。
本白皮书详细介绍了 NVIDIA 对保护 NVIDIA AI Enterprise 软件堆栈的承诺。 它概述了 NVIDIA 为确保容器安全而采取的流程和措施。
本指南涵盖了 NVIDIA AI Enterprise 的授权、打包和许可。 它旨在作为快速参考,以在高层次上了解产品以及相应的 SKU 信息。
本文档的目标是帮助组织选择 NVIDIA AI Enterprise 发布分支,并提供有关如何从一个分支移动到另一个分支的信息。
AI Enterprise 的教学视频。
AI Enterprise 的教学视频。
人工智能 (AI) 正在改变每个行业,无论是改善金融服务中的客户关系、简化制造商供应链,还是帮助医生为患者提供更好的治疗结果。
人工智能 (AI) 正在改变每个行业,无论是改善金融服务中的客户关系、简化制造商供应链,还是帮助医生为患者提供更好的治疗结果。
荷兰癌症研究所 (NKI) 自 1913 年以来一直处于癌症研究和治疗的前沿。 NKI 由国际知名的研究中心和专门的癌症诊所组成,将创新理念付诸行动,造福患者。
AI Enterprise 的教学视频。
NVIDIA AI Enterprise 经过认证可在广泛采用的企业平台(包括多云环境、VMware 和 Red Hat 的流行数据中心平台以及 NVIDIA 认证系统)上部署。

基础设施

此参考架构提供了 NVIDIA AI Enterprise 软件包的示例部署。 它展示了与 VMWare vShpere 的部署,并提供了示例工作负载来展示平台的功能。 将讨论硬件、网络和工作负载拓扑等主题。
本规模调整指南旨在指导希望大规模使用 NVIDIA 认证系统实施 NVIDIA AI Enterprise 的客户。
本文档旨在为 NVIDIA 的潜在和现有企业客户提供服务。 本用户指南是非约束性文档,应用于获取有关 NVIDIA 企业品牌支持和服务的信息。

培训,使您的团队能够充分利用 AI Enterprise。

本课程涵盖平台和解决方案概述、硬件和软件架构、部署选项、许可、时空 GPU 分区、扩展、全面验证、管理、维护、监控和故障排除。
探索 AI、GPU(图形处理单元)计算、NVIDIA AI 软件架构以及如何在数据中心实施和扩展 AI 工作负载的简介。
NVIDIA 许可证系统 (NLS) 是一种新的许可解决方案,旨在支持 NVIDIA 企业软件产品组合的持续扩展。 本课程将帮助您了解 NLS 以及如何从现有许可解决方案迁移到 NLS。