DGX SuperPOD 软件#

DGX SuperPOD 是一款软硬件集成的解决方案。其包含的软件 (图 12) 针对人工智能进行了由上至下的优化,从加速框架和工作流程管理,到系统管理和底层操作系统 (OS) 优化,堆栈的每个部分都旨在最大限度地提高 DGX SuperPOD 的性能和价值。

图 12. DGX SuperPOD 架构概述

_images/dgx-superpod-full-lifecycle-solutions.png

NVIDIA Base Command#

NVIDIA Base Command 为每个 DGX SuperPOD 提供支持,使组织能够充分利用 NVIDIA 软件创新的优势。企业可以通过成熟的平台充分发挥其投资潜力,该平台包括企业级编排和集群管理、加速计算、存储和网络基础设施的库,以及针对 AI 工作负载优化的操作系统。

NVIDIA NGC#

NVIDIA NGC (图 13) 提供软件,以满足具有不同 AI 专业水平的数据科学家、开发人员和研究人员的需求。

图 13. NGC 目录概述

_images/dgx-software-02.png

NGC 上托管的软件会针对一组聚合的常见漏洞和暴露 (CVE)、加密和私钥进行扫描。

来自 NGC 目录的软件经过测试和保证可以扩展到多个 GPU,在某些情况下,可以扩展到多节点,从而确保用户最大限度地利用其 DGX SuperPOD。

NVIDIA AI Enterprise#

NVIDIA AI Enterprise 是一套针对 AI 开发和部署优化的 AI 和数据分析软件。NVIDIA AI Enterprise 包括经过验证的开源容器和框架,例如 NVIDIA RAPIDS、NVIDIA TAO Toolkit、NVIDIA TensorRT™ 和 NVIDIA Triton Inference Server,它们经过认证并支持在 DGX SuperPOD 上运行。NVIDIA AI Enterprise 包含在 DGX SuperPOD 中,并与 NVIDIA Base Command 和 NVIDIA NGC 结合使用。