简介#
NVIDIA® DGX™ 系统随附 DGX™ 操作系统,该操作系统包含基于 Ubuntu Linux 发行版构建的 NVIDIA DGX 软件堆栈。除了运行 Ubuntu 发行版,您还可以在 DGX 系统上运行 Red Hat Enterprise Linux,并仍然可以利用高级 DGX 功能。
本文档介绍如何在安装了或 Rocky Linux 8 的 DGX 系统上安装和配置 NVIDIA DGX 软件堆栈。
注意
虽然可以使用 Red Hat Enterprise Linux 之外的其他衍生 Linux 发行版,但并非所有发行版都经过 NVIDIA 的测试和认证。有关经过测试和认证的软件和 Linux 发行版列表,请参阅DGX Red Hat Enterprise Linux 8 软件发行说明。
前提条件#
以下是必需的(或在指示处推荐的)。
Red Hat 订阅#
如果您计划在 DGX 上安装和使用 Red Hat Enterprise Linux 8,则需要 Red Hat 订阅。订阅还允许您从 Red Hat 软件和下载中心获取 Red Hat Enterprise Linux 的更新包和其他软件包。您可以购买订阅,也可以获取免费评估订阅。
注意
在可用的 Red Hat Enterprise Linux 平台中,DGX 系统(DGX 服务器和 DGX Station 工作站)仅支持 Red Hat Enterprise Linux 服务器。任何 DGX 系统都不支持其他 Red Hat Enterprise Linux 平台。
访问存储库#
可以从互联网访问存储库。
如果您的安装不允许连接到互联网,请参阅在气隙 NVIDIA DGX 系统上安装软件部分,了解有关在“气隙”系统上更新软件的信息。如果您正在使用代理服务器,请按照配置系统代理部分中的说明进行操作,以确保系统可以访问必要的 URI。
NVIDIA 存储库#
在 DGX 系统上安装 Red Hat Enterprise Linux 后,您必须启用 NVIDIA DGX 软件存储库 (https://repo.download.nvidia.com)。该存储库包含用于支持 DGX 系统的 NVIDIA 驱动程序和软件。
请参阅启用存储库部分,了解有关如何启用存储库的说明。
Red Hat 存储库#
在 Red Hat Enterprise Linux 8 上安装 DGX 软件需要访问多个其他存储库。
Red Hat Enterprise BaseOS 存储库:
rhel-8-for-x86_64-baseos-rpms
Red Hat Enterprise AppStream 存储库:
rhel-8-for-x86_64-appstream-rpms
Red Hat Enterprise CodeReady Linux Builder 存储库:
codeready-builder-for-rhel-8-x86_64-debug-rpms
网络文件系统#
在 DGX 服务器上,数据驱动器旨在用作缓存。DGX Station 用户可以遵循相同的用法,也可以选择将这些驱动器用于存储。当使用数据驱动器作为缓存时,建议使用网络文件系统 (NFS) 以利用 DGX 软件堆栈提供的缓存文件系统。
BMC 密码#
DGX BMC 随附默认登录凭据,如更改 BMC 登录名中所述。
重要提示
NVIDIA 建议尽快禁用默认用户名并创建唯一的 BMC 用户名和强密码。请参阅更改 BMC 登录名以获取说明。