简介

NVIDIA® DGX™ 系统 出厂时预装了 DGX™ OS,其中包含基于 Ubuntu Linux 发行版构建的 NVIDIA DGX 软件堆栈。除了运行 Ubuntu 发行版,您还可以在 DGX 系统上运行 CentOS,并仍然可以利用高级 DGX 功能。

本文档介绍如何在安装了 CentOS 或 Rocky Linux 8 的 DGX 系统上安装和配置 NVIDIA DGX 软件堆栈。
注意: 虽然可以使用除 CentOS 之外的其他衍生 Linux 发行版,但并非所有发行版都经过 NVIDIA 的测试和认证。有关经过测试和认证的软件和 Linux 发行版列表,请参阅 DGX Software for Red Hat Enterprise Linux 8 Release Notes

先决条件

以下是必需的(或在指示处推荐的)。

访问存储库

可以从互联网访问存储库。

如果您使用代理服务器,请按照配置系统代理部分中的说明操作,以确保系统可以访问必要的 URI。

NVIDIA 存储库

在 DGX 系统上安装 CentOS 后,您必须启用 NVIDIA DGX 软件存储库 (https://repo.download.nvidia.com)。该存储库包含用于支持 DGX 系统的 NVIDIA 驱动程序和软件。

有关如何启用存储库的说明,请参阅启用存储库部分。

CentOS 存储库

在 CentOS 上安装 DGX 软件需要访问几个额外的存储库。

  • CentOS 软件集合存储库: centos-release-scl

    NVSM 工具需要此存储库才能使用 Python 3。

  • CentOS 测试存储库: centos-sclo-rh-testing

    NVSM 工具需要此存储库才能使用 Python 3。

网络文件系统

在 DGX 服务器上,数据驱动器旨在用作缓存。DGX Station 用户可以遵循相同的用法,或者可以选择将这些驱动器用于存储。当将数据驱动器用作缓存时,建议使用网络文件系统 (NFS) 以利用 DGX 软件堆栈提供的缓存文件系统。

BMC 密码

DGX BMC 随附默认登录凭据,如附录 B:更改 BMC 登录名中所述。

重要提示

NVIDIA 建议尽快禁用默认用户名,并创建唯一的 BMC 用户名和强密码。有关说明,请参阅附录 C:更改 BMC 登录名