前提条件#
在 2.0 版本中添加。
硬件要求#
NVIDIA AI Enterprise 与 Red Hat OpenShift 和 VMware vSphere 具有以下前提条件
至少三台 NVIDIA AI Enterprise 兼容服务器,且为 NVIDIA 认证系统。
至少一台 NVIDIA AI Enterprise 兼容服务器必须具有 NVIDIA AI Enterprise 支持的 NVIDIA GPU。
推荐使用 A100 用于训练,A30 用于推理。
单根 I/O 虚拟化 (SR-IOV) 已启用
VT-d/IOMMU 已启用
GPU 加速服务器必须安装 NVIDIA AI Enterprise Host Software (VIB)。
注意
VMware ESXi 和 NVIDIA vGPU Host 及 Guest Driver Software 的安装不在本文档的范围之内。有关详细说明,请参阅 NVIDIA AI Enterprise 虚拟化部署指南。要在 VMware 上设置 AI 就绪的 VM,需要向 VM 添加 vGPU 配置文件。这需要先在 ESXi 上安装 vGPU Host Manager,附加 vGPU 配置文件,在 VM 上安装 vGPU guest driver,并为 VM 授予许可。以下指南章节对您有所帮助,可供参考
一旦三台 NVIDIA AI Enterprise 兼容服务器满足上述 NVIDIA AI Enterprise 硬件和软件要求,您必须 选择一种在 vSphere 上安装 OpenShift Container 的方法。对于本文档的编写,选择了 安装程序置备的基础架构 (IPI),因为它已预先配置并自动化了 OpenShift Container Platform 所需资源的置备。