前提条件#

如果您是虚拟化新手,建议您查看 VMware ESXi 入门,其中包含关于您可能已有的任何当前配置的课程和指南。

  • 至少一个 NVIDIA 数据中心 GPU,位于单个 NVIDIA AI Enterprise 兼容的 NVIDIA 认证系统中。 建议使用 A100 进行训练,A30 进行推理。

    • 如果使用 NVIDIA A100,则需要以下 BIOS 设置

      • 单根 I/O 虚拟化 (SR-IOV) - 已启用

      • VT-d/IOMMU - 已启用

  • NVIDIA AI Enterprise 许可证

  • VMware ESXi 7 Update 3 Hypervisor ISO

  • Ubuntu Server 20.04 amd64 ISO

  • NVIDIA AI Enterprise 软件

    • NVIDIA AI Enterprise 主机软件 (VIB)

    • NVIDIA Guest Driver

注意

NVIDIA AI Enterprise 主机软件 (VIB) 像驱动程序一样加载到 vSphere hypervisor 中,然后由 vCenter Server 管理。

您可以利用 NVIDIA 系统管理接口 (NV-SMI) 管理和监控工具进行测试和基准测试。

以下服务器配置详细信息被认为是最佳实践

  • 超线程 - 已启用

  • 电源设置或系统配置文件 - 高性能

  • CPU 性能(如果适用)- 企业级或高吞吐量

  • 4-GB 以上的内存映射 I/O - 已启用(如果适用)

注意

如果 NVIDIA 显卡检测未包含所有已安装的 GPU,请将此选项设置为“已启用”。