简介

NVIDIA® DGX™ 系统(DGX-1、DGX-2 和 DGX A100 服务器,以及 NVIDIA DGX Station™ 和 DGX Station A100 工作站) 随附 DGX™ OS,后者集成了基于 Ubuntu Linux 发行版构建的 NVIDIA DGX 软件栈。除了运行 Ubuntu 发行版之外,您还可以在 DGX 系统上运行 Red Hat Enterprise Linux,并仍然可以利用高级 DGX 功能。

本文档解释了如何在安装了 Red Hat Enterprise Linux 的 DGX 系统上安装和配置 NVIDIA DGX 软件栈。

注意: 虽然可能可以使用除 Red Hat Enterprise Linux 之外的其他派生 Linux 发行版,但并非所有发行版都经过 NVIDIA 测试和认证。请参阅 适用于 Red Hat Enterprise Linux 7 的 DGX 软件发行说明,以获取经过测试和认证的软件和 Linux 发行版的列表。

前提条件

以下是必需的(或在指示时推荐的)。

Red Hat 订阅

如果您计划在 DGX 上安装和使用 Red Hat Enterprise Linux 7,则需要 Red Hat 订阅。订阅还允许您获取 Red Hat Enterprise Linux 的更新包和附加包。您可以购买订阅,也可以从 Red Hat 软件与下载中心 获取免费评估订阅。

注意: 在可用的 Red Hat Enterprise Linux 平台 中, DGX 系统(DGX 服务器和 DGX Station 工作站)支持 Red Hat Enterprise Linux 服务器版。其他 Red Hat Enterprise Linux 平台在任何 DGX 系统上都不受支持。

访问软件仓库

可以从互联网访问软件仓库。

如果您的安装不允许连接到互联网,请参阅在气隙 NVIDIA DGX 系统上安装软件部分,以获取有关在“气隙”系统上更新软件的信息。

如果您正在使用代理服务器,请按照配置系统代理部分中的说明进行操作,以确保系统可以访问必要的 URI。

注意

您可以使用 yum-config-manager 方便地启用某些软件仓库。要使用 yum-config-manager,请先安装 yum 实用程序。

sudo yum -y install yum-utils 

NVIDIA 软件仓库

  • NVIDIA DGX 软件仓库

    在 DGX 系统上安装 Red Hat Enterprise Linux 后,您必须启用 NVIDIA DGX 软件仓库。该软件仓库包含用于支持 DGX 系统的 NVIDIA 驱动程序和软件。

    请参阅启用软件仓库部分,以获取有关如何启用软件仓库的说明。

Red Hat 软件仓库

在 Red Hat Enterprise Linux 7 上安装 DGX 软件需要访问几个额外的软件仓库。

  • Red Hat Enterprise Server Extras 软件仓库(容器支持所需)

    DGX 服务器:rhel-7-server-extras-rpms

    DGX Station:rhel-7-workstation-extras-rpms

  • Red Hat Enterprise Server Optional 软件仓库(NVIDIA 系统管理器 (NVSM) 和 GPU 驱动程序所需)

    DGX 服务器:rhel-7-server-optional-rpms

    DGX Station:rhel-7-workstation-optional-rpms

  • Red Hat Software Collections 软件仓库:

    NVSM 工具需要此软件仓库用于 Python 3。如果您无权访问 Red Hat 软件集合软件仓库,请参阅 https://access.redhat.com/solutions/472793,以获取有关免费请求访问权限的说明。

    重要提示: NVSM 不支持 python3 软件包。请务必仅按照安装诊断组件中的说明安装 rh-python36 软件包。

    DGX 服务器:rhel-server-rhscl-7-rpms

网络文件系统

在 DGX 服务器上,数据驱动器旨在用作缓存。DGX Station 用户可以遵循相同的用法,或者可以选择将这些驱动器用于存储。当使用数据驱动器作为缓存时,建议使用网络文件系统 (NFS) 以利用 DGX 软件栈提供的缓存文件系统。

BMC 密码

DGX BMC 随附默认登录凭据,如附录 B:更改 BMC 登录中所述。

重要提示

NVIDIA 建议尽快禁用默认用户名并创建唯一的 BMC 用户名和强密码。请参阅附录 B:更改 BMC 登录以获取说明。