在“气隙”系统上安装#
出于安全目的,某些安装要求系统与互联网或外部网络隔离。由于大多数 DGX 软件更新都是通过与 NVIDIA 服务器的网络连接过程完成的,因此本节解释了当无法使用网络连接方法时如何进行更新。它还包括安装容器的流程。
注册您的系统#
请参阅 Red Hat 客户门户知识库文章 如何离线注册系统并订阅 Red Hat 客户门户
创建 NVIDIA 仓库的本地镜像#
关于设置私有仓库或镜像 NVIDIA 和 Red Hat 仓库的说明超出了本文档的范围。预计用户了解这些过程。
Red Hat 客户门户提供了一篇关于 创建本地镜像 的知识库文章。请特别注意 使用 Red Hat Enterprise Linux 9 创建本地仓库 下的说明。reposync 命令现在也可以下载仓库元数据,因此不再需要之后使用 createrepo。
需要镜像的仓库是
rhel-9-for-x86_64-appstream-rpms
rhel-9-for-x86_64-baseos-rpms
codeready-builder-for-rhel-9-x86_64-rpms
nvidia-dgx-9
CUDA
镜像完成后,请务必配置目标系统以使用您的本地仓库。这可以通过在 /etc/yum.repos.d/my_mirror.repo
下创建文件并包含以下内容来完成
[nvidia-dgx-9]
name=NVIDIA DGX EL9
baseurl=file://path/to/your/nvidia-dgx-9-repo-mirror/
enabled=1
gpgcheck=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-dgx-cosmos-support
[CUDA]
name=NVIDIA CUDA for EL9
baseurl=file://path/to/your/CUDA-repo-mirror/
enabled=1
gpgcheck=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-cuda
注意
这些说明假设您已在本地计算机上启用仓库。有关启用 NVIDIA DGX EL8 仓库的说明,请参阅 启用 DGX 软件仓库。
CUDA 仓库使用了 模块化流。如果镜像到 Red Hat Enterprise Linux 9(或 Fedora)系统上,则可以使用单个命令同步模块化元数据
reposync -p /path/to/your/mirror/ --repoid=CUDA --download-metadata --downloadcomps
但是,如果您要将 CUDA 仓库镜像到另一个发行版(例如 Ubuntu、CentOS 7、Red Hat Enterprise Linux 7),则必须手动生成仓库元数据
reposync -p /path/to/your/mirror/ --repoid=CUDA --downloadcomps
createrepo -v /path/to/your/mirror/
python3 genmodules.py /path/to/your/mirror/ /tmp/modules.yaml
modifyrepo /tmp/modules.yaml /path/to/your/mirror/repodata/
请注意,您可以从 GitHub 上的 NVIDIA 的 yum-packaging-precompiled-kmod 仓库中找到 genmodules.py 脚本
安装 Docker 容器#
此方法适用于 NGC 容器注册表上托管的 Docker 容器。大多数容器镜像都是免费提供的,但有些是锁定的,需要您拥有 NGC 帐户才能访问。有关访问锁定的容器镜像的说明,请参阅 NGC 私有注册表用户指南。
输入 docker pull 命令,指定镜像注册表、镜像仓库和标签。
docker pull nvcr.io/nvidia/repository:tag
使用 docker images 验证镜像是否在您的系统上。
docker images
将 Docker 镜像另存为存档。
docker save nvcr.io/nvidia/repository:tag > framework.tar
使用可移动介质(例如 USB 闪存驱动器)将镜像传输到气隙系统。
加载 NVIDIA Docker 镜像。
docker load -i framework.tar
验证镜像是否在您的系统上。
docker images