摘要#
采用 NVIDIA DGX H100 系统的 DGX SuperPOD 是下一代数据中心规模架构,旨在满足 AI 训练不断增长的迫切需求。本 DGX SuperPOD 参考架构 (RA) 文档介绍了 NVIDIA 用于自身 AI 模型和 HPC 研发的架构。DGX SuperPOD 在其高性能基础上不断发展,以支持最大型 NLP 模型的训练,满足汽车应用训练模型的海量需求,并扩展推荐模型,从而提高准确性并加快周转时间。
DGX SuperPOD 代表一个完整的系统,不仅包含硬件,还包括所有必要的软件,以加速部署时间、简化系统管理、主动识别系统问题,并支持与您在 DGX SuperPOD、笔记本电脑或其他基于 NVIDIA GPU 的系统上使用的相同的加速软件。所有这些组件的结合使系统可靠运行,保持最佳性能,并使用户能够突破最先进技术的界限。该平台旨在支持当前的工作负载,并不断发展以支持未来的应用。