基础设施支持矩阵#

受支持的 NVIDIA 基础设施软件#

受支持的基础设施软件#

产品

版本

x86

ARM

NVIDIA GPU 数据中心驱动程序

550.144.03

受支持

受支持

NVIDIA DOCA 网络驱动程序

v24.10 (DOCA 2.9.1)

受支持

受支持

NVIDIA vGPU (C-Series 驱动程序主机和 Guest)

17.5

受支持

不支持

NVIDIA Container Toolkit

v1.17.4

受支持

受支持

NVIDIA GPU Operator

v24.9.2

受支持

受支持

NVIDIA Network Operator

v24.10.1

受支持

受支持

NVIDIA Base Command Manager Essentials (BCME)

10.24.11

受支持

受支持

NVIDIA NIM Operator

v1.0.1

受支持

不支持

受支持的 NVIDIA GPU 和网络#

NVIDIA AI Enterprise 在以下 NVIDIA GPU 上受支持,并兼容在 NVIDIA 认证系统 页面上列出的第三方服务器。

特定的 NVIDIA AI Enterprise 支持的产品可能不支持所有操作系统或 GPU;有关任何差异,请参阅各个产品的发行说明。

  • NVIDIA H800

  • NVIDIA H800 NVL

  • NVIDIA H100

  • NVIDIA H100 NVL [1]

  • NVIDIA H20

  • NVIDIA GH200

  • NVIDIA A800

  • NVIDIA AX800

  • NVIDIA A100X

  • NVIDIA A100

  • NVIDIA A40

  • NVIDIA A30X

  • NVIDIA A30

  • NVIDIA A16

  • NVIDIA A10

  • NVIDIA A10G

  • NVIDIA A10M

  • NVIDIA A2

  • NVIDIA RTX A6000

  • NVIDIA RTX A5000

  • NVIDIA RTX A4000

  • NVIDIA L40S

  • NVIDIA L40

  • NVIDIA L20

  • NVIDIA L4

  • NVIDIA L2

  • NVIDIA RTX 6000 Ada Generation

  • NVIDIA RTX 4000 SFF Ada Generation

  • NVIDIA T4

  • NVIDIA T4G

  • NVIDIA Quadro RTX 8000

  • NVIDIA Quadro RTX 6000

  • NVIDIA Quadro RTX 4000

  • NNVIDIA V100

多节点需要支持 RoCE 的以太网 NIC。 NVIDIA 建议使用 NVIDIA Mellanox ConnectX 和 NVIDIA GPU 以获得最佳性能。

受支持的以太网 NIC 和 SuperNIC#

产品系列

架构

NVIDIA ConnectX-6 NIC

NVIDIA ConnectX-6

NVIDIA ConnectX-6 Dx NIC

NVIDIA ConnectX-6 Dx

NVIDIA ConnectX-7 NIC

NVIDIA ConnectX-7

NVIDIA BlueField-3 SuperNIC

NVIDIA BlueField-3

受支持的平台#

NVIDIA AI Enterprise 在裸机部署中的 NVIDIA DGX 服务器上受支持,并使用包含在 DGX OS 软件中的 NVIDIA 数据中心驱动程序。

受支持的平台#

加速平台

架构

NVIDIA DGX H100

NVIDIA Hopper

NVIDIA DGX A100

NVIDIA Ampere

NVIDIA HGX H800

NVIDIA Hopper

NVIDIA HGX H200 [11]

NVIDIA Hopper

NVIDIA HGX H100

NVIDIA Hopper

NVIDIA HGX H20

NVIDIA Hopper

NVIDIA HGX A800

NVIDIA Ampere

NVIDIA HGX A100

NVIDIA Ampere

NVIDIA IGX Orin [2]

NVIDIA Ada Lovelace

注意

DGX 平台、带有 KVM 虚拟机监控程序的 HGX 平台和 IGX Orin 不支持 NVIDIA vGPU (C-Series)。

对于 NVIDIA IGX,请参阅 NVIDIA AI Enterprise - IGX 封装、定价和许可指南

裸机#

如果您有专用的本地物理服务器,请参阅以下 NVIDIA AI Enterprise 平台支持矩阵。

在裸机上使用 Kubernetes 编排的容器#

编排平台

操作系统

NVIDIA AI Enterprise 基础设施支持

名称

版本

引擎

名称

版本

GPU Operator

Network Operator

GPU 驱动程序支持 [3]

Charmed Kubernetes

  • 1.28

  • 1.29

  • 1.30

Containerd

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

受支持

受支持

vGPU Guest/数据中心

HPE Ezmeral Runtime Enterprise

5.6

Containerd

Red Hat Enterprise Linux

  • 8.6

  • 8.8

  • 8.10

受支持

不支持

vGPU Guest/数据中心

Red Hat OpenShift [4]

  • 4.13

  • 4.14

  • 4.15

  • 4.16

CRI-O

Red Hat CoreOS

  • 4.13

  • 4.14

  • 4.15

  • 4.16

受支持

受支持

vGPU Guest/数据中心

Nutanix NKP

  • 2.12

  • 2.13

Containerd

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

受支持

不支持

vGPU Guest/数据中心

上游 Kubernetes

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

Containerd

Red Hat Enterprise Linux

  • 8.6

  • 8.8

  • 8.10

受支持

受支持 [5]

vGPU Guest/数据中心

上游 Kubernetes

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

Containerd

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

受支持

受支持 [5]

vGPU Guest/数据中心

上游 Kubernetes

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

CRI-O

Red Hat Enterprise Linux

  • 8.6

  • 8.8

  • 8.10

受支持

受支持

vGPU Guest/数据中心

上游 Kubernetes

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

CRI-O

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

受支持

不支持

vGPU Guest/数据中心

裸机上的独立容器#

容器

操作系统

NVIDIA AI Enterprise 基础设施支持

名称

版本

引擎

名称

版本

GPU Operator

Network Operator

GPU 驱动程序支持

非 Kubernetes(独立容器)

Docker/Podman

Red Hat Enterprise Linux

  • 7.9

  • 8.6

  • 8.8

  • 8.10

  • 9.2

  • 9.4

不适用

不适用

vGPU Guest/数据中心

非 Kubernetes(独立容器)

Docker/Podman

SUSE Linux Enterprise Server

15 SP2 及更高版本

不适用

不适用

vGPU Guest/数据中心

非 Kubernetes(独立容器)

Docker/Podman

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

不适用

不适用

vGPU Guest/数据中心

虚拟化#

如果您有物理服务器被分隔成多个本地虚拟服务器,请参阅以下 NVIDIA AI Enterprise 平台支持矩阵。

在虚拟化环境中用 Kubernetes 编排的容器#

编排平台

Guest 操作系统

虚拟机监控程序

NVIDIA AI Enterprise 基础设施支持

名称

版本

引擎

名称

版本

名称

版本

GPU Operator

Network Operator

GPU 驱动程序支持 (虚拟机内部)

vGPU

直通 [6]

Charmed Kubernetes

  • 1.28

  • 1.29

  • 1.30

Containerd

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

Ubuntu [7] [10]

  • 20.04 LTS

  • 22.04 LTS

受支持

受支持

vGPU Guest

vGPU Guest/数据中心

Charmed Kubernetes

  • 1.28

  • 1.29

  • 1.30

Containerd

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

VMware vSphere

  • 7.0 update 2 及更高版本

  • 8.0 及更高版本

受支持

受支持

vGPU Guest

vGPU Guest/数据中心

Red Hat OpenShift [8]

  • 4.13

  • 4.14

  • 4.15

  • 4.16

CRI-O

Red Hat CoreOS

  • 4.13

  • 4.14

  • 4.15

  • 4.16

Red Hat Enterprise Linux [7] [10]

  • 7.9

  • 8.6

  • 8.8

  • 8.10

  • 9.2

  • 9.4

受支持

受支持

vGPU Guest

vGPU Guest/数据中心

Red Hat OpenShift [8]

  • 4.13

  • 4.14

  • 4.15

  • 4.16

CRI-O

Red Hat CoreOS

  • 4.13

  • 4.14

  • 4.15

  • 4.16

VMware vSphere

  • 7.0 update 2 及更高版本

  • 8.0 及更高版本

受支持

受支持

vGPU Guest

vGPU Guest/数据中心

VMware vSphere with Tanzu

TKR 1.23 - TKR 1.30

Containerd

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

VMware vSphere

  • 7.0 update 2 及更高版本

  • 8.0 及更高版本

受支持

不支持

vGPU Guest

vGPU Guest/数据中心

Nutanix NKP

  • 2.12

  • 2.13

Containerd

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

Nutanix AOS/AHV [7] [10]

  • 6.5

  • 6.6

  • 6.7

  • 6.8

  • 6.9

  • 6.10

受支持

不支持

vGPU Guest

vGPU Guest/数据中心

上游 Kubernetes

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

Containerd

Red Hat Enterprise Linux

  • 8.6

  • 8.8

  • 8.10

Red Hat Enterprise Linux [7] [10]

  • 7.9

  • 8.6

  • 8.8

  • 8.10

  • 9.2

  • 9.4

受支持

受支持 [5]

vGPU Guest

vGPU Guest/数据中心

上游 Kubernetes

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

Containerd

Red Hat Enterprise Linux

  • 8.6

  • 8.8

  • 8.10

VMware vSphere

  • 7.0 update 2 及更高版本

  • 8.0 及更高版本

受支持

受支持 [5]

vGPU Guest

vGPU Guest/数据中心

上游 Kubernetes

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

Containerd

Red Hat Enterprise Linux

  • 8.6

  • 8.8

  • 8.10

Nutanix AOS/AHV [7] [10]

  • 6.5

  • 6.6

  • 6.7

  • 6.8

  • 6.9

  • 6.10

受支持

受支持 [5]

vGPU Guest

vGPU Guest/数据中心

上游 Kubernetes

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

Containerd

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

Ubuntu [7] [10]

  • 20.04 LTS

  • 22.04 LTS

受支持

受支持 [5]

vGPU Guest

vGPU Guest/数据中心

上游 Kubernetes

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

Containerd

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

VMware vSphere

  • 7.0 update 2 及更高版本

  • 8.0

受支持

受支持 [5]

vGPU Guest

vGPU Guest/数据中心

上游 Kubernetes

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

Containerd

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

Nutanix AOS/AHV [7] [10]

  • 6.5

  • 6.6

  • 6.7

  • 6.8

  • 6.9

  • 6.10

受支持

受支持 [5]

vGPU Guest

vGPU Guest/数据中心

上游 Kubernetes

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

CRI-O

Red Hat Enterprise Linux

  • 8.6

  • 8.8

  • 8.10

Red Hat Enterprise Linux [7] [10]

  • 7.9

  • 8.6

  • 8.8

  • 8.10

  • 9.2

  • 9.4

受支持

受支持 [5]

vGPU Guest

vGPU Guest/数据中心

上游 Kubernetes

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

CRI-O

Red Hat Enterprise Linux

  • 8.6

  • 8.8

  • 8.10

VMware vSphere

  • 7.0 update 2 及更高版本

  • 8.0 及更高版本

受支持

受支持 [5]

vGPU Guest

vGPU Guest/数据中心

上游 Kubernetes

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

CRI-O

Red Hat Enterprise Linux

  • 8.6

  • 8.8

  • 8.10

Nutanix AOS/AHV [7] [10]

  • 6.5

  • 6.6

  • 6.7

  • 6.8

  • 6.9

  • 6.10

受支持

受支持 [5]

vGPU Guest

vGPU Guest/数据中心

上游 Kubernetes

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

CRI-O

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

Ubuntu [7] [10]

  • 20.04 LTS

  • 22.04 LTS

受支持

不支持 [5]

vGPU Guest

vGPU Guest/数据中心

上游 Kubernetes

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

CRI-O

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

VMware vSphere

  • 7.0 update 2 及更高版本

  • 8.0 及更高版本

受支持

不支持 [5]

vGPU Guest

vGPU Guest/数据中心

上游 Kubernetes

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

CRI-O

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

Nutanix AOS/AHV [7] [10]

  • 6.5

  • 6.6

  • 6.7

  • 6.8

  • 6.9

  • 6.10

受支持

不支持 [5]

vGPU Guest

vGPU Guest/数据中心

注意

如果 My Nutanix 门户 (https://portal.nutanix.com/page/downloads?product=ahv%26bit=NVIDIA) 中没有您需要的 NVIDIA AI Enterprise 版本,请联系 Nutanix。然后,按照 My Nutanix 门户上的说明从 NVIDIA 许可门户获取正确的 NVIDIA AI Enterprise 图形驱动程序。

虚拟化环境中的独立容器#

容器

Guest 操作系统

虚拟机监控程序

NVIDIA AI Enterprise 基础设施支持

名称

版本

引擎

名称

版本

名称

版本

GPU Operator

Network Operator

GPU 驱动程序支持 (虚拟机内部)

vGPU

直通 [6]

非 Kubernetes(独立容器)

Docker/Podman

Red Hat Enterprise Linux

  • 7.9

  • 8.6

  • 8.8

  • 8.10

  • 9.2

  • 9.4

Red Hat Enterprise Linux [7]

  • 7.9

  • 8.6

  • 8.8

  • 8.9

  • 9.2

  • 9.4

不适用

不适用

vGPU Guest

vGPU Guest/数据中心

非 Kubernetes(独立容器)

Docker/Podman

Red Hat Enterprise Linux

  • 7.9

  • 8.6

  • 8.8

  • 8.10

  • 9.2

  • 9.4

VMware vSphere

  • 7.0 update 2 及更高版本

  • 8.0 及更高版本

不适用

不适用

vGPU Guest

vGPU Guest/数据中心

非 Kubernetes(独立容器)

Docker/Podman

SUSE Linux Enterprise Server

15 SP2 及更高版本

VMWare vSphere

  • 7.0 update 2 及更高版本

  • 8.0 及更高版本

不适用

不适用

vGPU Guest

vGPU Guest/数据中心

非 Kubernetes(独立容器)

Docker/Podman

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

  • 24.04 LTS

Ubuntu [7] [10]

  • 20.04 LTS

  • 22.04 LTS

不适用

不适用

vGPU Guest

vGPU Guest/数据中心

非 Kubernetes(独立容器)

Docker/Podman

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

  • 24.04 LTS

VMware vSphere

  • 7.0 update 2 及更高版本

  • 8.0 及更高版本

不适用

不适用

vGPU Guest

vGPU Guest/数据中心

非 Kubernetes(独立容器)

Docker/Podman

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

  • 24.04 LTS

Nutanix AOS/AHV [7] [9] [10]

  • 6.5

  • 6.6

  • 6.7

  • 6.8

  • 6.9

  • 6.10

不适用

不适用

vGPU Guest

vGPU Guest/数据中心

注意

如果 My Nutanix 门户 (https://portal.nutanix.com/page/downloads?product=ahv%26bit=NVIDIA) 中没有您需要的 NVIDIA AI Enterprise 版本,请联系 Nutanix。然后,按照 My Nutanix 门户上的说明从 NVIDIA 许可门户获取正确的 NVIDIA AI Enterprise 图形驱动程序。

在虚拟机监控程序和 Guest 操作系统上使用 vGPU 支持的非容器化应用程序#

虚拟机监控程序

Guest 操作系统

NVIDIA AI Enterprise 基础设施支持

名称

版本

名称

版本

vGPU

VMware ESX

ESXi 8.0

Debian

12

vGPU Guest

VMware ESX

ESXi 8.0

Red Hat Enterprise Linux

  • 8.8

  • 8.10

  • 9.2

  • 9.4

vGPU Guest

VMware ESX

ESXi 8.0

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

  • 24.04 LTS

vGPU Guest

VMware ESX

ESXi 8.0

SUSE Linux Enterprise Server

  • 12 SP3+

  • 12 SP5

  • 15 SP2

vGPU Guest

VMware ESX

ESXi 8.0

Microsoft Windows

  • Server 2022

  • Windows 11, 10

vGPU Guest

VMware ESX

ESXi 7.0 Update 2

Red Hat Enterprise Linux

  • 8.8

  • 8.10

  • 9.2

  • 9.4

vGPU Guest

VMware ESX

ESXi 7.0 Update 2

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

  • 24.04 LTS

vGPU Guest

VMware ESX

ESXi 7.0 Update 2

SUSE Linux Enterprise Server

  • 12 SP3+

  • 12 SP5

  • 15 SP2

vGPU Guest

VMware ESX

ESXi 7.0 Update 2

Microsoft Windows

  • Server 2022

  • Windows 11, 10

vGPU Guest

Ubuntu [7] [10]

  • 20.04 LTS

  • 22.04 LTS

  • 24.04 LTS

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

  • 24.04 LTS

vGPU Guest

Red Hat Enterprise Linux (RHEL) with KVM [7] [10]

RHEL 8.8

Red Hat Enterprise Linux

  • 8.8

  • 8.10

vGPU Guest

Red Hat Enterprise Linux (RHEL) with KVM [7] [10]

RHEL 8.8

Microsoft Windows

Server 2022

vGPU Guest

Red Hat Enterprise Linux (RHEL) with KVM [7] [10]

RHEL 8.10

Red Hat Enterprise Linux

  • 8.8

  • 8.10

vGPU Guest

Red Hat Enterprise Linux (RHEL) with KVM [7] [10]

RHEL 8.10

Microsoft Windows

Server 2022

vGPU Guest

Red Hat Enterprise Linux (RHEL) with KVM [7] [10]

RHEL 9.2

Red Hat Enterprise Linux

  • 8.8

  • 8.10

  • 9.2

  • 9.4

vGPU Guest

Red Hat Enterprise Linux (RHEL) with KVM [7] [10]

RHEL 9.2

Microsoft Windows

Server 2022

vGPU Guest

Red Hat Enterprise Linux (RHEL) with KVM [7] [10]

RHEL 9.4

Red Hat Enterprise Linux

  • 8.8

  • 8.10

  • 9.2

  • 9.4

vGPU Guest

Red Hat Enterprise Linux (RHEL) with KVM [7] [10]

RHEL 9.4

Microsoft Windows

Server 2022

vGPU Guest

Red Hat Enterprise Linux (RHEL) with KVM [7] [10]

  • Red Hat OpenStack Platform

  • Red Hat OpenStack Services on OpenShift

Red Hat OpenStack 产品文档

Red Hat OpenStack 产品文档

vGPU Guest

Nutanix AOS/AHV [7] [10]

  • AOS/AHV 6.5

  • AOS/AHV 6.6

  • AOS/AHV 6.7

  • AOS/AHV 6.8

  • AOS/AHV 6.9

  • AOS/AHV 6.10

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

  • 24.04 LTS

vGPU Guest

Nutanix AOS/AHV [7] [10]

  • AOS/AHV 6.5

  • AOS/AHV 6.6

  • AOS/AHV 6.7

  • AOS/AHV 6.8

  • AOS/AHV 6.9

  • AOS/AHV 6.10

Debian

12

vGPU Guest

Nutanix AOS/AHV [7] [10]

  • AOS/AHV 6.5

  • AOS/AHV 6.6

  • AOS/AHV 6.7

  • AOS/AHV 6.8

  • AOS/AHV 6.9

  • AOS/AHV 6.10

Red Hat Enterprise Linux

  • 8.8

  • 8.10

  • 9.2

  • 9.4

vGPU Guest

Nutanix AOS/AHV [7] [10]

  • AOS/AHV 6.5

  • AOS/AHV 6.6

  • AOS/AHV 6.7

  • AOS/AHV 6.8

  • AOS/AHV 6.9

  • AOS/AHV 6.10

SUSE Linux Enterprise Server

  • 12

  • 15

vGPU Guest

注意

如果 My Nutanix 门户 (https://portal.nutanix.com/page/downloads?product=ahv%26bit=NVIDIA) 中没有您需要的 NVIDIA AI Enterprise 版本,请联系 Nutanix。然后,按照 My Nutanix 门户上的说明从 NVIDIA 许可门户获取正确的 NVIDIA AI Enterprise 图形驱动程序。

Base Command Manager Essentials#

Base Command Manager#

编排平台

操作系统

NVIDIA AI Enterprise 基础设施支持

名称

版本

引擎

名称

版本

GPU Operator

Network Operator

GPU 驱动程序支持 [2]

上游 Kubernetes

  • 1.27

  • 1.28

  • 1.29

  • 1.30

Containerd

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

受支持

受支持

数据中心

上游 Kubernetes

  • 1.27

  • 1.28

  • 1.29

  • 1.30

Containerd

Red Hat Enterprise Linux

  • 8

  • 9

受支持

受支持

数据中心

Slurm (非 Kubernetes)

  • 23.02

  • 23.11

  • 24.05

不适用

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

不适用

不适用

数据中心

Slurm (非 Kubernetes)

  • 23.02

  • 23.11

  • 24.05

不适用

Red Hat Enterprise Linux

  • 8

  • 9

不适用

不适用

数据中心

PBS Pro

  • 2024.1.1

  • 2022.1.6

不适用

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

不适用

不适用

数据中心

PBS Pro

  • 2024.1.1

  • 2022.1.6

不适用

Red Hat Enterprise Linux

  • 8

  • 9

不适用

不适用

数据中心

公有云#

托管 Kubernetes#

如果您有在云计算环境中运行且可远程访问的虚拟服务器,请参阅以下 NVIDIA AI Enterprise 平台支持矩阵。

托管 Kubernetes#

云服务提供商

编排平台

操作系统

NVIDIA AI Enterprise 基础设施支持

名称

K8s 版本

引擎

名称

版本

GPU Operator

Network Operator

GPU 驱动程序支持

AWS

Amazon Elastic Kubernetes Service (EKS)

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

Containerd

Ubuntu

  • 20.04 LTS

  • 22.04 LTS

受支持

不支持

vGPU Guest/数据中心

Google

Google Kubernetes Engine (GKE)

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

Containerd

Ubuntu

22.04 LTS

受支持

不支持

vGPU Guest/数据中心

Microsoft

Azure Kubernetes Service (AKS)

  • 1.24

  • 1.25

  • 1.26

  • 1.27

  • 1.28

  • 1.29

  • 1.30

Containerd

Ubuntu

22.04 LTS

受支持

不支持

vGPU Guest/数据中心

不适用

Red Hat OpenShift (托管服务)

  • 4.13

  • 4.14

  • 4.15

  • 4.16

CRI-O

Red Hat CoreOS

  • 4.13

  • 4.14

  • 4.15

  • 4.16

受支持

不支持

vGPU Guest/数据中心

标准 GPU 实例#

Kubernetes 和独立容器的标准实例#

云服务提供商

带有 GPU 的虚拟机 (VM) 实例

产品系列

阿里云

gn7e

NVIDIA A10

阿里云

gn7i

NVIDIA A10

阿里云

gn7s

NVIDIA A30

阿里云

gn6i

NVIDIA T4

阿里云

gn6e

NVIDIA V100

阿里云

gn6v

NVIDIA V100

阿里云

ecs.ebmgn8v

NVIDIA H20

阿里云

ecs.gn8v

NVIDIA H20

阿里云

ecs.ebmgn8is

NVIDIA L20

阿里云

ecs.gn8is

NVIDIA L20

Amazon Web Services (AWS)

EC2 P3

NVIDIA V100

Amazon Web Services (AWS)

EC2 P4

NVIDIA A100

Amazon Web Services (AWS)

EC2 P5

NVIDIA H100

Amazon Web Services (AWS)

EC2 G4

NVIDIA T4

Amazon Web Services (AWS)

EC2 G5

NVIDIA A10G

Amazon Web Services (AWS)

EC2 G6

NVIDIA L4

Amazon Web Services (AWS)

EC2 G6e

NVIDIA L40S

Azure

NCads_H100_v5-series

NVIDIA H100

Azure

NCCads_H100_v5-series

NVIDIA H100

Azure

NCv3-series

NVIDIA V100

Azure

NCasT4_v3-series

NVIDIA T4

Azure

NC_A100_v4-series

NVIDIA A100

Google Cloud Platform (GCP)

A3 VM

NVIDIA H100

Google Cloud Platform (GCP)

A2 VM

NVIDIA A100

Google Cloud Platform (GCP)

G2 VM

NVIDIA L4

Google Cloud Platform (GCP)

N1 VM

  • NVIDIA T4

  • NVIDIA V100

Oracle Cloud Infrastructure (OCI)

BM.GPU3

NVIDIA V100

Oracle Cloud Infrastructure (OCI)

  • BM.GPU4

  • BM.GPU.A100

NVIDIA A100

Oracle Cloud Infrastructure (OCI)

BM.GPU.A10

NVIDIA A10

Oracle Cloud Infrastructure (OCI)

BM.GPU.H100.8

NVIDIA H100

Oracle Cloud Infrastructure (OCI)

VM.GPU3

NVIDIA V100

Oracle Cloud Infrastructure (OCI)

VM.GPU.A10

NVIDIA A10

腾讯云

PNV4

NVIDIA A10

腾讯云

GT4

NVIDIA A100

腾讯云

  • GN10Xp

  • GN10X

NVIDIA V100

腾讯云

  • GN7

  • GN7vi

  • GI3X

NVIDIA T4

火山引擎

ecs.gni2

NVIDIA A10

CSP 市场上的 NVIDIA GPU 优化 VMI#

为了便于在云中使用,NVIDIA 提供了计算优化和验证的基础虚拟机实例 (VMI),以通过 CSP 市场运行独立的 NVIDIA AI 容器。每个 VMI 都包含 NVIDIA 的关键技术和软件,用于在现代混合云中快速部署、管理和扩展 AI 工作负载。

CSP 市场上的 NVIDIA GPU 优化 VMI#

云服务提供商

VMI 名称

GPU

K8s 支持

独立容器

AWS

NVIDIA AI Enterprise

标准 GPU 实例 中列出

不支持

受支持

Azure

NVIDIA AI Enterprise

标准 GPU 实例 中列出

不支持

受支持

GCP

NVIDIA AI Enterprise

标准 GPU 实例 中列出

不支持

受支持

仅 CPU 服务器支持#

NVIDIA AI Enterprise 将支持以下启用 CPU 的框架

  • TensorFlow

  • PyTorch

  • 带有 FIL 后端的 Triton Inference Server

  • 带有 XGBoost 和 Dask 的 NVIDIA RAPIDS

启用 CPU 的框架在 NVIDIA 认证系统 列表中包含的仅 CPU 服务器上受支持。

脚注