基础设施支持矩阵#
受支持的 NVIDIA 基础设施软件#
产品 |
版本 |
x86 |
ARM |
---|---|---|---|
NVIDIA GPU 数据中心驱动程序 |
受支持 |
受支持 |
|
NVIDIA DOCA 网络驱动程序 |
受支持 |
受支持 |
|
NVIDIA vGPU (C-Series 驱动程序主机和 Guest) |
受支持 |
不支持 |
|
NVIDIA Container Toolkit |
受支持 |
受支持 |
|
NVIDIA GPU Operator |
受支持 |
受支持 |
|
NVIDIA Network Operator |
受支持 |
受支持 |
|
NVIDIA Base Command Manager Essentials (BCME) |
受支持 |
受支持 |
|
NVIDIA NIM Operator |
受支持 |
不支持 |
受支持的 NVIDIA GPU 和网络#
NVIDIA AI Enterprise 在以下 NVIDIA GPU 上受支持,并兼容在 NVIDIA 认证系统 页面上列出的第三方服务器。
特定的 NVIDIA AI Enterprise 支持的产品可能不支持所有操作系统或 GPU;有关任何差异,请参阅各个产品的发行说明。
NVIDIA H800
NVIDIA H800 NVL
NVIDIA H100
NVIDIA H100 NVL [1]
NVIDIA H20
NVIDIA GH200
NVIDIA A800
NVIDIA AX800
NVIDIA A100X
NVIDIA A100
NVIDIA A40
NVIDIA A30X
NVIDIA A30
NVIDIA A16
NVIDIA A10
NVIDIA A10G
NVIDIA A10M
NVIDIA A2
NVIDIA RTX A6000
NVIDIA RTX A5000
NVIDIA RTX A4000
NVIDIA L40S
NVIDIA L40
NVIDIA L20
NVIDIA L4
NVIDIA L2
NVIDIA RTX 6000 Ada Generation
NVIDIA RTX 4000 SFF Ada Generation
NVIDIA T4
NVIDIA T4G
NVIDIA Quadro RTX 8000
NVIDIA Quadro RTX 6000
NVIDIA Quadro RTX 4000
NNVIDIA V100
多节点需要支持 RoCE 的以太网 NIC。 NVIDIA 建议使用 NVIDIA Mellanox ConnectX 和 NVIDIA GPU 以获得最佳性能。
产品系列 |
架构 |
---|---|
NVIDIA ConnectX-6 NIC |
NVIDIA ConnectX-6 |
NVIDIA ConnectX-6 Dx NIC |
NVIDIA ConnectX-6 Dx |
NVIDIA ConnectX-7 NIC |
NVIDIA ConnectX-7 |
NVIDIA BlueField-3 SuperNIC |
NVIDIA BlueField-3 |
受支持的平台#
NVIDIA AI Enterprise 在裸机部署中的 NVIDIA DGX 服务器上受支持,并使用包含在 DGX OS 软件中的 NVIDIA 数据中心驱动程序。
加速平台 |
架构 |
---|---|
NVIDIA DGX H100 |
NVIDIA Hopper |
NVIDIA DGX A100 |
NVIDIA Ampere |
NVIDIA HGX H800 |
NVIDIA Hopper |
NVIDIA HGX H200 [11] |
NVIDIA Hopper |
NVIDIA HGX H100 |
NVIDIA Hopper |
NVIDIA HGX H20 |
NVIDIA Hopper |
NVIDIA HGX A800 |
NVIDIA Ampere |
NVIDIA HGX A100 |
NVIDIA Ampere |
NVIDIA IGX Orin [2] |
NVIDIA Ada Lovelace |
注意
DGX 平台、带有 KVM 虚拟机监控程序的 HGX 平台和 IGX Orin 不支持 NVIDIA vGPU (C-Series)。
对于 NVIDIA IGX,请参阅 NVIDIA AI Enterprise - IGX 封装、定价和许可指南。
裸机#
如果您有专用的本地物理服务器,请参阅以下 NVIDIA AI Enterprise 平台支持矩阵。
编排平台 |
操作系统 |
NVIDIA AI Enterprise 基础设施支持 |
|||||
---|---|---|---|---|---|---|---|
名称 |
版本 |
引擎 |
名称 |
版本 |
GPU Operator |
Network Operator |
|
Charmed Kubernetes |
|
Containerd |
Ubuntu |
|
受支持 |
受支持 |
vGPU Guest/数据中心 |
HPE Ezmeral Runtime Enterprise |
5.6 |
Containerd |
Red Hat Enterprise Linux |
|
受支持 |
不支持 |
vGPU Guest/数据中心 |
Red Hat OpenShift [4] |
|
CRI-O |
Red Hat CoreOS |
|
受支持 |
受支持 |
vGPU Guest/数据中心 |
Nutanix NKP |
|
Containerd |
Ubuntu |
|
受支持 |
不支持 |
vGPU Guest/数据中心 |
上游 Kubernetes |
|
Containerd |
Red Hat Enterprise Linux |
|
受支持 |
受支持 [5] |
vGPU Guest/数据中心 |
上游 Kubernetes |
|
Containerd |
Ubuntu |
|
受支持 |
受支持 [5] |
vGPU Guest/数据中心 |
上游 Kubernetes |
|
CRI-O |
Red Hat Enterprise Linux |
|
受支持 |
受支持 |
vGPU Guest/数据中心 |
上游 Kubernetes |
|
CRI-O |
Ubuntu |
|
受支持 |
不支持 |
vGPU Guest/数据中心 |
容器 |
操作系统 |
NVIDIA AI Enterprise 基础设施支持 |
|||||
---|---|---|---|---|---|---|---|
名称 |
版本 |
引擎 |
名称 |
版本 |
GPU Operator |
Network Operator |
|
非 Kubernetes(独立容器) |
Docker/Podman |
Red Hat Enterprise Linux |
|
不适用 |
不适用 |
vGPU Guest/数据中心 |
|
非 Kubernetes(独立容器) |
Docker/Podman |
SUSE Linux Enterprise Server |
15 SP2 及更高版本 |
不适用 |
不适用 |
vGPU Guest/数据中心 |
|
非 Kubernetes(独立容器) |
Docker/Podman |
Ubuntu |
|
不适用 |
不适用 |
vGPU Guest/数据中心 |
虚拟化#
如果您有物理服务器被分隔成多个本地虚拟服务器,请参阅以下 NVIDIA AI Enterprise 平台支持矩阵。
编排平台 |
Guest 操作系统 |
虚拟机监控程序 |
NVIDIA AI Enterprise 基础设施支持 |
|||||||
---|---|---|---|---|---|---|---|---|---|---|
名称 |
版本 |
引擎 |
名称 |
版本 |
名称 |
版本 |
GPU Operator |
Network Operator |
GPU 驱动程序支持 (虚拟机内部) |
|
vGPU |
直通 [6] |
|||||||||
Charmed Kubernetes |
|
Containerd |
Ubuntu |
|
|
受支持 |
受支持 |
vGPU Guest |
vGPU Guest/数据中心 |
|
Charmed Kubernetes |
|
Containerd |
Ubuntu |
|
VMware vSphere |
|
受支持 |
受支持 |
vGPU Guest |
vGPU Guest/数据中心 |
Red Hat OpenShift [8] |
|
CRI-O |
Red Hat CoreOS |
|
|
受支持 |
受支持 |
vGPU Guest |
vGPU Guest/数据中心 |
|
Red Hat OpenShift [8] |
|
CRI-O |
Red Hat CoreOS |
|
VMware vSphere |
|
受支持 |
受支持 |
vGPU Guest |
vGPU Guest/数据中心 |
VMware vSphere with Tanzu |
TKR 1.23 - TKR 1.30 |
Containerd |
Ubuntu |
|
VMware vSphere |
|
受支持 |
不支持 |
vGPU Guest |
vGPU Guest/数据中心 |
Nutanix NKP |
|
Containerd |
Ubuntu |
|
|
受支持 |
不支持 |
vGPU Guest |
vGPU Guest/数据中心 |
|
上游 Kubernetes |
|
Containerd |
Red Hat Enterprise Linux |
|
|
受支持 |
受支持 [5] |
vGPU Guest |
vGPU Guest/数据中心 |
|
上游 Kubernetes |
|
Containerd |
Red Hat Enterprise Linux |
|
VMware vSphere |
|
受支持 |
受支持 [5] |
vGPU Guest |
vGPU Guest/数据中心 |
上游 Kubernetes |
|
Containerd |
Red Hat Enterprise Linux |
|
|
受支持 |
受支持 [5] |
vGPU Guest |
vGPU Guest/数据中心 |
|
上游 Kubernetes |
|
Containerd |
Ubuntu |
|
|
受支持 |
受支持 [5] |
vGPU Guest |
vGPU Guest/数据中心 |
|
上游 Kubernetes |
|
Containerd |
Ubuntu |
|
VMware vSphere |
|
受支持 |
受支持 [5] |
vGPU Guest |
vGPU Guest/数据中心 |
上游 Kubernetes |
|
Containerd |
Ubuntu |
|
|
受支持 |
受支持 [5] |
vGPU Guest |
vGPU Guest/数据中心 |
|
上游 Kubernetes |
|
CRI-O |
Red Hat Enterprise Linux |
|
|
受支持 |
受支持 [5] |
vGPU Guest |
vGPU Guest/数据中心 |
|
上游 Kubernetes |
|
CRI-O |
Red Hat Enterprise Linux |
|
VMware vSphere |
|
受支持 |
受支持 [5] |
vGPU Guest |
vGPU Guest/数据中心 |
上游 Kubernetes |
|
CRI-O |
Red Hat Enterprise Linux |
|
|
受支持 |
受支持 [5] |
vGPU Guest |
vGPU Guest/数据中心 |
|
上游 Kubernetes |
|
CRI-O |
Ubuntu |
|
|
受支持 |
不支持 [5] |
vGPU Guest |
vGPU Guest/数据中心 |
|
上游 Kubernetes |
|
CRI-O |
Ubuntu |
|
VMware vSphere |
|
受支持 |
不支持 [5] |
vGPU Guest |
vGPU Guest/数据中心 |
上游 Kubernetes |
|
CRI-O |
Ubuntu |
|
|
受支持 |
不支持 [5] |
vGPU Guest |
vGPU Guest/数据中心 |
注意
如果 My Nutanix 门户 (https://portal.nutanix.com/page/downloads?product=ahv%26bit=NVIDIA) 中没有您需要的 NVIDIA AI Enterprise 版本,请联系 Nutanix。然后,按照 My Nutanix 门户上的说明从 NVIDIA 许可门户获取正确的 NVIDIA AI Enterprise 图形驱动程序。
容器 |
Guest 操作系统 |
虚拟机监控程序 |
NVIDIA AI Enterprise 基础设施支持 |
|||||||
---|---|---|---|---|---|---|---|---|---|---|
名称 |
版本 |
引擎 |
名称 |
版本 |
名称 |
版本 |
GPU Operator |
Network Operator |
GPU 驱动程序支持 (虚拟机内部) |
|
vGPU |
直通 [6] |
|||||||||
非 Kubernetes(独立容器) |
Docker/Podman |
Red Hat Enterprise Linux |
|
Red Hat Enterprise Linux [7] |
|
不适用 |
不适用 |
vGPU Guest |
vGPU Guest/数据中心 |
|
非 Kubernetes(独立容器) |
Docker/Podman |
Red Hat Enterprise Linux |
|
VMware vSphere |
|
不适用 |
不适用 |
vGPU Guest |
vGPU Guest/数据中心 |
|
非 Kubernetes(独立容器) |
Docker/Podman |
SUSE Linux Enterprise Server |
15 SP2 及更高版本 |
VMWare vSphere |
|
不适用 |
不适用 |
vGPU Guest |
vGPU Guest/数据中心 |
|
非 Kubernetes(独立容器) |
Docker/Podman |
Ubuntu |
|
|
不适用 |
不适用 |
vGPU Guest |
vGPU Guest/数据中心 |
||
非 Kubernetes(独立容器) |
Docker/Podman |
Ubuntu |
|
VMware vSphere |
|
不适用 |
不适用 |
vGPU Guest |
vGPU Guest/数据中心 |
|
非 Kubernetes(独立容器) |
Docker/Podman |
Ubuntu |
|
|
不适用 |
不适用 |
vGPU Guest |
vGPU Guest/数据中心 |
注意
如果 My Nutanix 门户 (https://portal.nutanix.com/page/downloads?product=ahv%26bit=NVIDIA) 中没有您需要的 NVIDIA AI Enterprise 版本,请联系 Nutanix。然后,按照 My Nutanix 门户上的说明从 NVIDIA 许可门户获取正确的 NVIDIA AI Enterprise 图形驱动程序。
虚拟机监控程序 |
Guest 操作系统 |
NVIDIA AI Enterprise 基础设施支持 |
||
---|---|---|---|---|
名称 |
版本 |
名称 |
版本 |
vGPU |
VMware ESX |
ESXi 8.0 |
Debian |
12 |
vGPU Guest |
VMware ESX |
ESXi 8.0 |
Red Hat Enterprise Linux |
|
vGPU Guest |
VMware ESX |
ESXi 8.0 |
Ubuntu |
|
vGPU Guest |
VMware ESX |
ESXi 8.0 |
SUSE Linux Enterprise Server |
|
vGPU Guest |
VMware ESX |
ESXi 8.0 |
Microsoft Windows |
|
vGPU Guest |
VMware ESX |
ESXi 7.0 Update 2 |
Red Hat Enterprise Linux |
|
vGPU Guest |
VMware ESX |
ESXi 7.0 Update 2 |
Ubuntu |
|
vGPU Guest |
VMware ESX |
ESXi 7.0 Update 2 |
SUSE Linux Enterprise Server |
|
vGPU Guest |
VMware ESX |
ESXi 7.0 Update 2 |
Microsoft Windows |
|
vGPU Guest |
|
Ubuntu |
|
vGPU Guest |
|
RHEL 8.8 |
Red Hat Enterprise Linux |
|
vGPU Guest |
|
RHEL 8.8 |
Microsoft Windows |
Server 2022 |
vGPU Guest |
|
RHEL 8.10 |
Red Hat Enterprise Linux |
|
vGPU Guest |
|
RHEL 8.10 |
Microsoft Windows |
Server 2022 |
vGPU Guest |
|
RHEL 9.2 |
Red Hat Enterprise Linux |
|
vGPU Guest |
|
RHEL 9.2 |
Microsoft Windows |
Server 2022 |
vGPU Guest |
|
RHEL 9.4 |
Red Hat Enterprise Linux |
|
vGPU Guest |
|
RHEL 9.4 |
Microsoft Windows |
Server 2022 |
vGPU Guest |
|
|
vGPU Guest |
|||
|
Ubuntu |
|
vGPU Guest |
|
|
Debian |
12 |
vGPU Guest |
|
|
Red Hat Enterprise Linux |
|
vGPU Guest |
|
|
SUSE Linux Enterprise Server |
|
vGPU Guest |
注意
如果 My Nutanix 门户 (https://portal.nutanix.com/page/downloads?product=ahv%26bit=NVIDIA) 中没有您需要的 NVIDIA AI Enterprise 版本,请联系 Nutanix。然后,按照 My Nutanix 门户上的说明从 NVIDIA 许可门户获取正确的 NVIDIA AI Enterprise 图形驱动程序。
Base Command Manager Essentials#
编排平台 |
操作系统 |
NVIDIA AI Enterprise 基础设施支持 |
|||||
---|---|---|---|---|---|---|---|
名称 |
版本 |
引擎 |
名称 |
版本 |
GPU Operator |
Network Operator |
|
上游 Kubernetes |
|
Containerd |
Ubuntu |
|
受支持 |
受支持 |
数据中心 |
上游 Kubernetes |
|
Containerd |
Red Hat Enterprise Linux |
|
受支持 |
受支持 |
数据中心 |
Slurm (非 Kubernetes) |
|
不适用 |
Ubuntu |
|
不适用 |
不适用 |
数据中心 |
Slurm (非 Kubernetes) |
|
不适用 |
Red Hat Enterprise Linux |
|
不适用 |
不适用 |
数据中心 |
PBS Pro |
|
不适用 |
Ubuntu |
|
不适用 |
不适用 |
数据中心 |
PBS Pro |
|
不适用 |
Red Hat Enterprise Linux |
|
不适用 |
不适用 |
数据中心 |
公有云#
托管 Kubernetes#
如果您有在云计算环境中运行且可远程访问的虚拟服务器,请参阅以下 NVIDIA AI Enterprise 平台支持矩阵。
云服务提供商 |
编排平台 |
操作系统 |
NVIDIA AI Enterprise 基础设施支持 |
|||||
---|---|---|---|---|---|---|---|---|
名称 |
K8s 版本 |
引擎 |
名称 |
版本 |
GPU Operator |
Network Operator |
||
AWS |
Amazon Elastic Kubernetes Service (EKS) |
|
Containerd |
Ubuntu |
|
受支持 |
不支持 |
vGPU Guest/数据中心 |
Google Kubernetes Engine (GKE) |
|
Containerd |
Ubuntu |
22.04 LTS |
受支持 |
不支持 |
vGPU Guest/数据中心 |
|
Microsoft |
Azure Kubernetes Service (AKS) |
|
Containerd |
Ubuntu |
22.04 LTS |
受支持 |
不支持 |
vGPU Guest/数据中心 |
不适用 |
Red Hat OpenShift (托管服务) |
|
CRI-O |
Red Hat CoreOS |
|
受支持 |
不支持 |
vGPU Guest/数据中心 |
标准 GPU 实例#
云服务提供商 |
带有 GPU 的虚拟机 (VM) 实例 |
产品系列 |
---|---|---|
阿里云 |
gn7e |
NVIDIA A10 |
阿里云 |
gn7i |
NVIDIA A10 |
阿里云 |
gn7s |
NVIDIA A30 |
阿里云 |
gn6i |
NVIDIA T4 |
阿里云 |
gn6e |
NVIDIA V100 |
阿里云 |
gn6v |
NVIDIA V100 |
阿里云 |
ecs.ebmgn8v |
NVIDIA H20 |
阿里云 |
ecs.gn8v |
NVIDIA H20 |
阿里云 |
ecs.ebmgn8is |
NVIDIA L20 |
阿里云 |
ecs.gn8is |
NVIDIA L20 |
Amazon Web Services (AWS) |
EC2 P3 |
NVIDIA V100 |
Amazon Web Services (AWS) |
EC2 P4 |
NVIDIA A100 |
Amazon Web Services (AWS) |
EC2 P5 |
NVIDIA H100 |
Amazon Web Services (AWS) |
EC2 G4 |
NVIDIA T4 |
Amazon Web Services (AWS) |
EC2 G5 |
NVIDIA A10G |
Amazon Web Services (AWS) |
EC2 G6 |
NVIDIA L4 |
Amazon Web Services (AWS) |
EC2 G6e |
NVIDIA L40S |
Azure |
NCads_H100_v5-series |
NVIDIA H100 |
Azure |
NCCads_H100_v5-series |
NVIDIA H100 |
Azure |
NCv3-series |
NVIDIA V100 |
Azure |
NCasT4_v3-series |
NVIDIA T4 |
Azure |
NC_A100_v4-series |
NVIDIA A100 |
Google Cloud Platform (GCP) |
A3 VM |
NVIDIA H100 |
Google Cloud Platform (GCP) |
A2 VM |
NVIDIA A100 |
Google Cloud Platform (GCP) |
G2 VM |
NVIDIA L4 |
Google Cloud Platform (GCP) |
N1 VM |
|
Oracle Cloud Infrastructure (OCI) |
BM.GPU3 |
NVIDIA V100 |
Oracle Cloud Infrastructure (OCI) |
|
NVIDIA A100 |
Oracle Cloud Infrastructure (OCI) |
BM.GPU.A10 |
NVIDIA A10 |
Oracle Cloud Infrastructure (OCI) |
BM.GPU.H100.8 |
NVIDIA H100 |
Oracle Cloud Infrastructure (OCI) |
VM.GPU3 |
NVIDIA V100 |
Oracle Cloud Infrastructure (OCI) |
VM.GPU.A10 |
NVIDIA A10 |
腾讯云 |
PNV4 |
NVIDIA A10 |
腾讯云 |
GT4 |
NVIDIA A100 |
腾讯云 |
|
NVIDIA V100 |
腾讯云 |
|
NVIDIA T4 |
火山引擎 |
ecs.gni2 |
NVIDIA A10 |
CSP 市场上的 NVIDIA GPU 优化 VMI#
为了便于在云中使用,NVIDIA 提供了计算优化和验证的基础虚拟机实例 (VMI),以通过 CSP 市场运行独立的 NVIDIA AI 容器。每个 VMI 都包含 NVIDIA 的关键技术和软件,用于在现代混合云中快速部署、管理和扩展 AI 工作负载。
仅 CPU 服务器支持#
NVIDIA AI Enterprise 将支持以下启用 CPU 的框架
TensorFlow
PyTorch
带有 FIL 后端的 Triton Inference Server
带有 XGBoost 和 Dask 的 NVIDIA RAPIDS
启用 CPU 的框架在 NVIDIA 认证系统 列表中包含的仅 CPU 服务器上受支持。
脚注