简介
NVIDIA® DGX™ 系统 出厂时预装了 DGX™ OS,其中包含基于 Ubuntu Linux 发行版构建的 NVIDIA DGX 软件堆栈。除了运行 Ubuntu 发行版,您还可以在 DGX 系统上运行 CentOS,并仍然可以利用高级 DGX 功能。
本文档介绍如何在安装了 CentOS 或 Rocky Linux 8 的 DGX 系统上安装和配置 NVIDIA DGX 软件堆栈。
注意: 虽然可以使用除 CentOS 之外的其他衍生 Linux 发行版,但并非所有发行版都经过 NVIDIA 的测试和认证。有关经过测试和认证的软件和 Linux 发行版列表,请参阅 DGX Software for Red Hat Enterprise Linux 8 Release Notes。
先决条件
以下是必需的(或在指示处推荐的)。
访问存储库
可以从互联网访问存储库。
如果您使用代理服务器,请按照配置系统代理部分中的说明操作,以确保系统可以访问必要的 URI。
NVIDIA 存储库
在 DGX 系统上安装 CentOS 后,您必须启用 NVIDIA DGX 软件存储库 (https://repo.download.nvidia.com)。该存储库包含用于支持 DGX 系统的 NVIDIA 驱动程序和软件。
有关如何启用存储库的说明,请参阅启用存储库部分。
CentOS 存储库
在 CentOS 上安装 DGX 软件需要访问几个额外的存储库。
- CentOS 软件集合存储库: centos-release-scl
NVSM 工具需要此存储库才能使用 Python 3。
- CentOS 测试存储库: centos-sclo-rh-testing
NVSM 工具需要此存储库才能使用 Python 3。
网络文件系统
在 DGX 服务器上,数据驱动器旨在用作缓存。DGX Station 用户可以遵循相同的用法,或者可以选择将这些驱动器用于存储。当将数据驱动器用作缓存时,建议使用网络文件系统 (NFS) 以利用 DGX 软件堆栈提供的缓存文件系统。
BMC 密码
DGX BMC 随附默认登录凭据,如附录 B:更改 BMC 登录名中所述。
重要提示
NVIDIA 建议尽快禁用默认用户名,并创建唯一的 BMC 用户名和强密码。有关说明,请参阅附录 C:更改 BMC 登录名。