前提条件#
如果您是虚拟化新手,建议您查看 VMware ESXi 入门,其中包含关于您可能已有的任何当前配置的课程和指南。
至少一个 NVIDIA 数据中心 GPU,位于单个 NVIDIA AI Enterprise 兼容的 NVIDIA 认证系统中。 建议使用 A100 进行训练,A30 进行推理。
如果使用 NVIDIA A100,则需要以下 BIOS 设置
单根 I/O 虚拟化 (SR-IOV) - 已启用
VT-d/IOMMU - 已启用
NVIDIA AI Enterprise 许可证
VMware ESXi 7 Update 3 Hypervisor ISO
Ubuntu Server 20.04 amd64 ISO
NVIDIA AI Enterprise 软件
NVIDIA AI Enterprise 主机软件 (VIB)
NVIDIA Guest Driver
注意
NVIDIA AI Enterprise 主机软件 (VIB) 像驱动程序一样加载到 vSphere hypervisor 中,然后由 vCenter Server 管理。
您可以利用 NVIDIA 系统管理接口 (NV-SMI) 管理和监控工具进行测试和基准测试。
以下服务器配置详细信息被认为是最佳实践
超线程 - 已启用
电源设置或系统配置文件 - 高性能
CPU 性能(如果适用)- 企业级或高吞吐量
4-GB 以上的内存映射 I/O - 已启用(如果适用)
注意
如果 NVIDIA 显卡检测未包含所有已安装的 GPU,请将此选项设置为“已启用”。