概述#

NVIDIA AI Enterprise 是一个端到端、云原生的 AI 和数据分析软件套件,经过 NVIDIA 优化、认证和支持,可在 VMware vSphere 上运行。VMware + NVIDIA AI-Ready 企业平台包含 NVIDIA 的重要支持技术,可用于 AI 工作负载的快速部署、管理和扩展。

本部署指南旨在指导如何将高性能多节点集群设置为虚拟机。在本指南中,您将熟悉 GPUDirect RDMA 和 ATS,同时使用 Docker 作为运行高性能多节点深度学习训练的平台。ATS 是 vSphere 7 Update 2 中 VMware PCIe 支持的增强功能。GPUDirect RDMA 受益于 ATS,并经过 NVIDIA AI Enterprise 的认证和支持。