DGX SuperPOD 软件#

DGX SuperPOD 是一个集成的硬件和软件解决方案。 随附的软件(图 12)从上到下都针对 AI 进行了优化,从加速框架和工作流程管理到系统管理和底层操作系统 (OS) 优化,堆栈的每个部分都旨在最大限度地提高 DGX SuperPOD 的性能和价值。

_images/image15.png

图 12. DGX SuperPOD 高级架构#

NVIDIA Base Command#

NVIDIA Base Command 为每个 DGX SuperPOD 提供支持,使组织能够充分利用 NVIDIA 软件创新的优势。 企业可以通过经过验证的平台充分发挥其投资潜力,该平台包括企业级编排和集群管理、加速计算、存储和网络基础设施的库以及针对 AI 工作负载优化的操作系统。

NVIDIA NGC#

NGC(图 13)提供软件以满足具有不同 AI 专业水平的数据科学家、开发人员和研究人员的需求。

_images/image17.png

图 13. NGC 目录概述#

NGC 上托管的软件会针对一组常见的漏洞和暴露 (CVE)、加密和私钥进行扫描。

来自 NGC 目录的软件经过测试,确保可以扩展到多个 GPU,在某些情况下,可以扩展到多节点,从而确保用户最大限度地利用其 DGX SuperPOD。

NVIDIA AI Enterprise#

NVIDIA AI Enterprise 是端到端软件平台,使每个企业都能触及生成式 AI,为使用 NVIDIA DGX 平台开发的生成式 AI 基础模型提供最快、最高效的运行时。 凭借生产级的安全性、稳定性和可管理性,它简化了生成式 AI 解决方案的开发。 DGX SuperPOD 随附 NVIDIA AI Enterprise,供企业开发人员访问预训练模型、优化框架、微服务、加速库和企业支持。

_images/image18.png

图 14. NVIDIA AI Enterprise 软件堆栈#