使用本地仓库安装软件#

作为附录 A 中描述的 reposync 方法的替代方案,也可以使用本地仓库安装软件。NVIDIA 提供的这些仓库将在本地文件系统中安装所有可用的软件包,从而允许在没有网络访问的情况下安装软件包。

安装基础 Red Hat Enterprise Linux 系统#

软件的 Red Hat 组件必须使用标准的基于网络的安装方式安装,或者按照附录 A 中的描述进行安装。这包括注册和订阅 Red Hat 客户门户。

如果系统已连接到网络,请按照标准的 Red Hat 安装步骤进行操作,然后启用其他 Red Hat 仓库。最后,执行

sudo dnf update -y
sudo dnf install -y kernel-devel kernel-headers
sudo reboot

如果系统未连接到网络,请按照附录 A 中的说明使用 reposync 镜像 Red Hat 仓库。

下载本地仓库#

下载适用于您版本的软件包。

版本 EL8-24.07

版本 EL8-24.01

版本 EL8-23.08

版本 EL8-22.08

版本 EL8-22.06

安装本地仓库#

安装本地仓库

sudo dnf install -y ./dgx-local-repo-24.07-4.el8.x86_64.rpm
sudo dnf install -y ./nvidia-driver-local-repo-rhel8-535.183.01-1.0-1.x86_64.rpm
sudo dnf install -y ./cuda-repo-rhel8-12-2-local-12.2.2_535.104.05-1.x86_64.rpm

安装本地仓库后,继续执行标准的 安装 DGX 软件 说明,但 CUDA 驱动程序安装除外。要从本地仓库安装 CUDA 驱动程序,请按照下一节 从本地仓库安装 NVIDIA CUDA 驱动程序 中的步骤进行操作。

从本地仓库安装 NVIDIA CUDA 驱动程序#

  • 对于非 NVSwitch 系统,如 DGX-1、DGX Station、DGX Station A100 和 DGX Station A800,请使用默认配置文件安装驱动程序

    sudo dnf module install -y nvidia-driver:535-dkms
    sudo dnf install -y nv-persistence-mode libnvidia-nscq-535
    
  • 对于 NVSwitch 系统,如 DGX-2 和 DGX A100/A800,请使用 fabricmanager (fm) 配置文件安装驱动程序

    sudo dnf module install -y nvidia-driver:535-dkms/fm
    sudo dnf install -y nv-persistence-mode nvidia-fm-enable
    
  • 对于 DGX H100,请使用 fabric manager (fm) 配置文件安装 DKMS 版本的驱动程序

    sudo dnf module install -y nvidia-driver:535-dkms/fm
    sudo dnf install -y nv-persistence-mode nvidia-fm-enable