摘要#

NVIDIA 与 VMware 的紧密合作旨在为客户带来最佳的加速计算体验,并加速企业中 ML/AI 应用的采用。VMware + NVIDIA AI-Ready 企业平台包含 NVIDIA 的关键赋能技术,用于 AI 工作负载的快速部署、管理和扩展。

在本部署指南中,我们探讨了如何将高性能多节点集群设置为虚拟机。一旦 RoCE 安装/配置完成且 ATS 启用,我们就使用 Docker 作为平台来运行高性能多节点深度学习训练。