在“气隙”系统上安装#

出于安全目的,某些安装要求系统与互联网或外部网络隔离。由于大多数 DGX 软件更新都是通过与 NVIDIA 服务器的网络连接过程完成的,因此本节解释了当无法使用网络连接方法时如何进行更新。它还包括安装容器的流程。

注册您的系统#

请参阅 Red Hat 客户门户知识库文章 如何离线注册系统并订阅 Red Hat 客户门户

创建 NVIDIA 仓库的本地镜像#

关于设置私有仓库或镜像 NVIDIA 和 Red Hat 仓库的说明超出了本文档的范围。预计用户了解这些过程。

Red Hat 客户门户提供了一篇关于 创建本地镜像 的知识库文章。请特别注意 使用 Red Hat Enterprise Linux 9 创建本地仓库 下的说明。reposync 命令现在也可以下载仓库元数据,因此不再需要之后使用 createrepo。

需要镜像的仓库是

  • rhel-9-for-x86_64-appstream-rpms

  • rhel-9-for-x86_64-baseos-rpms

  • codeready-builder-for-rhel-9-x86_64-rpms

  • nvidia-dgx-9

  • CUDA

镜像完成后,请务必配置目标系统以使用您的本地仓库。这可以通过在 /etc/yum.repos.d/my_mirror.repo 下创建文件并包含以下内容来完成

[nvidia-dgx-9]
name=NVIDIA DGX EL9
baseurl=file://path/to/your/nvidia-dgx-9-repo-mirror/
enabled=1
gpgcheck=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-dgx-cosmos-support

[CUDA]
name=NVIDIA CUDA for EL9
baseurl=file://path/to/your/CUDA-repo-mirror/
enabled=1
gpgcheck=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-cuda

注意

这些说明假设您已在本地计算机上启用仓库。有关启用 NVIDIA DGX EL8 仓库的说明,请参阅 启用 DGX 软件仓库

CUDA 仓库使用了 模块化流。如果镜像到 Red Hat Enterprise Linux 9(或 Fedora)系统上,则可以使用单个命令同步模块化元数据

reposync -p /path/to/your/mirror/ --repoid=CUDA --download-metadata --downloadcomps

但是,如果您要将 CUDA 仓库镜像到另一个发行版(例如 Ubuntu、CentOS 7、Red Hat Enterprise Linux 7),则必须手动生成仓库元数据

reposync -p /path/to/your/mirror/ --repoid=CUDA --downloadcomps
createrepo -v /path/to/your/mirror/
python3 genmodules.py /path/to/your/mirror/ /tmp/modules.yaml
modifyrepo /tmp/modules.yaml /path/to/your/mirror/repodata/

请注意,您可以从 GitHub 上的 NVIDIA 的 yum-packaging-precompiled-kmod 仓库中找到 genmodules.py 脚本

NVIDIA/yum-packaging-precompiled-kmod

安装 Docker 容器#

此方法适用于 NGC 容器注册表上托管的 Docker 容器。大多数容器镜像都是免费提供的,但有些是锁定的,需要您拥有 NGC 帐户才能访问。有关访问锁定的容器镜像的说明,请参阅 NGC 私有注册表用户指南

  1. 输入 docker pull 命令,指定镜像注册表、镜像仓库和标签。

    docker pull nvcr.io/nvidia/repository:tag
    
  2. 使用 docker images 验证镜像是否在您的系统上。

    docker images
    
  3. 将 Docker 镜像另存为存档。

    docker save nvcr.io/nvidia/repository:tag > framework.tar
    
  4. 使用可移动介质(例如 USB 闪存驱动器)将镜像传输到气隙系统。

  5. 加载 NVIDIA Docker 镜像。

    docker load -i framework.tar
    
  6. 验证镜像是否在您的系统上。

    docker images