使用 Base Command 构建 AI 卓越中心

步骤 #1:设置 Docker

注意

如果您已经完成了 在 Base Command 中使用修改后的 NGC 镜像 实验的步骤 #1,则应完全跳过此步骤,并转到步骤 #2。

在开始之前,需要在本地工作站上安装 Docker,以便可以拉取、运行、修改容器并将其推送到 NGC。这假定您在工作站上运行基于 Linux 的现代操作系统,并具有外部互联网访问权限以及具有 root 或 sudo 权限的用户。以下命令显示的是使用 sudo 而不是 root。理想情况下,至少应安装一个 NVIDIA GPU 以及最新的驱动程序。

如果您的工作站上未安装 Docker,您可以按照以下步骤进行安装。否则,跳到下一节以验证您的 Docker 安装。建议遵循最新的官方 Docker 安装说明,但为了方便起见,此处复制了 Ubuntu 和 Debian 环境的关键步骤。此外,可以在此处找到安装 NVIDIA Container Toolkit 的步骤,并且也复制如下。

首先,使用安装脚本安装 Docker

复制
已复制!
            

$ curl https://get.docker.com | sh \ && sudo systemctl --now enable docker

接下来,安装 NVIDIA Container Toolkit,它添加了在容器内部使用 NVIDIA GPU 的支持。如果您没有 NVIDIA GPU,则可以跳到下一节。

复制
已复制!
            

$ distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \ && curl -s -L https://nvidia.github.io/libnvidia-container/gpgkey | sudo apt-key add - \ && curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.list | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

接下来,更新您的软件包管理器并安装 nvidia-docker2

复制
已复制!
            

$ sudo apt update $ sudo apt install -y nvidia-docker2

最后,重启 Docker 服务以完成安装

复制
已复制!
            

$ sudo systemctl restart docker

默认情况下,Docker 只能通过 root 用户或使用 sudo 以 root 权限执行。要在没有 root 权限的情况下运行 Docker,您需要将所需的用户添加到 docker 组。这可以通过运行以下命令来完成(您可以将 $USER 替换为您工作站上的任何特定用户)

复制
已复制!
            

$ sudo usermod -aG docker $USER

将用户添加到 docker 组后,注销并重新登录任何已添加的用户,以使更改生效。完成后,所有指定的用户现在都可以使用 Docker,而无需 root 权限。

NVIDIA GPU 支持已添加到 Docker 版本 19.03。为了使用 GPU 进行测试,您需要运行此版本或更高版本。要检查您的版本,请运行

复制
已复制!
            

$ docker --version

如果这显示“Docker version 19.03”或更新版本,则表示您的 Docker 安装受支持。如果显示的版本早于 19.03,请按照上述说明安装最新版本的 Docker,包括必要的 NVIDIA Container Toolkit。

© 版权所有 2022-2023 NVIDIA。 上次更新时间:2023 年 1 月 10 日。