简介#
本文档介绍了在安装了红帽企业 Linux 的 DGX 系统上安装和配置 NVIDIA DGX 软件堆栈的方法。
NVIDIA 提供了 NVIDIA DGX 软件堆栈,目标是在用户安装了红帽企业 Linux 的 DGX 系统上进行安装。该软件堆栈提供了与基于 Ubuntu 构建的原始 DGX 操作系统相同的功能。
注意
NVIDIA 认识到 Rocky Linux 的广泛使用,并理解它是 NVIDIA 支持的红帽企业 Linux 的社区开发衍生版本。Rocky Linux 的支持可直接从 Rocky Linux 社区获得。NVIDIA 确保 NVIDIA 提供的软件在经过测试的 Rocky Linux 版本上运行,并将尝试识别和纠正与 NVIDIA 提供的软件相关的问题。
虽然可能可以使用其他派生的 Linux 发行版,但并非所有发行版都经过 NVIDIA 的测试和认证。有关经过测试和认证的软件和 Linux 发行版的列表,请参阅发行说明。
开始之前#
以下是必需的(或在指示处为推荐的)。
红帽订阅#
如果您计划在 DGX 系统上安装和使用红帽企业 Linux,则需要红帽订阅。订阅还允许您获取红帽企业 Linux 的更新包和其他包。您可以购买订阅,也可以从红帽软件与下载中心获取免费评估订阅。
访问存储库#
可以从互联网访问存储库。
如果您正在使用代理服务器,请按照配置系统代理部分中的说明操作,以确保系统可以访问必要的 URI。
NVIDIA 存储库
在 DGX 系统上安装红帽企业 Linux 后,您必须启用 NVIDIA DGX 软件存储库 (https://repo.download.nvidia.com)。该存储库包含用于支持 DGX 系统的 NVIDIA 驱动程序和软件。
有关如何启用存储库的说明,请参阅启用 DGX 软件存储库部分。
红帽存储库
在红帽企业 Linux 9 上安装 DGX 软件需要访问多个额外的存储库。
红帽企业 BaseOS 存储库:
rhel-9-for-x86_64-baseos-rpms
红帽企业 AppStream 存储库:
rhel-9-for-x86_64-appstream-rpms
红帽企业 CodeReady Linux Builder 存储库:
codeready-builder-for-rhel-9-x86_64-debug-rpms
网络文件系统#
在 DGX 服务器上,数据驱动器旨在用作缓存。DGX Station 用户可以遵循相同的用法,或者可以选择将这些驱动器用于存储。当将数据驱动器用作缓存时,建议使用网络文件系统 (NFS) 以利用 DGX 软件堆栈提供的缓存文件系统。
BMC 密码#
NVIDIA DGX 服务器包括一个基板管理控制器 (BMC),用于对 DGX 系统进行带外管理。NVIDIA 建议尽快禁用默认用户名并创建唯一的用户名和密码。