先决条件#

在 2.0 版本中添加。

硬件要求#

NVIDIA AI Enterprise 与 Red Hat OpenShift 具有以下先决条件集

  • 至少三台 NVIDIA AI Enterprise 兼容服务器,它们是 NVIDIA 认证系统

    注意

    单节点 OpenShift 集群不具备 HA。有关更多详细信息,请参考在单节点上安装 OpenShift 指南

  • 至少一台 NVIDIA AI Enterprise 兼容服务器必须具有 NVIDIA AI Enterprise 支持的 NVIDIA GPU

  • 建议 A100 用于训练,A30 用于推理。

    • 单根 I/O 虚拟化 (SR-IOV) 已启用 (可选)

    • VT-d/IOMMU 已启用 (可选)

  • GPU 加速服务器必须安装 NVIDIA AI Enterprise 软件。

一旦三台 NVIDIA AI Enterprise 兼容服务器满足上述 NVIDIA AI Enterprise 硬件和软件要求,您必须选择一种方法来安装用于裸机的 OpenShift Container Platform。对于本文档的编写,选择了安装程序置备基础架构 (IPI),因为它已预先配置并自动执行 OpenShift Container Platform 所需资源的置备。