步骤 #1:设置 Docker
如果您已经完成了 在 Base Command 中使用修改后的 NGC 镜像
实验的步骤 #1,则应完全跳过此步骤,并转到步骤 #2。
在开始之前,需要在本地工作站上安装 Docker,以便可以拉取、运行、修改容器并将其推送到 NGC。这假定您在工作站上运行基于 Linux 的现代操作系统,并具有外部互联网访问权限以及具有 root 或 sudo 权限的用户。以下命令显示的是使用 sudo 而不是 root。理想情况下,至少应安装一个 NVIDIA GPU 以及最新的驱动程序。
如果您的工作站上未安装 Docker,您可以按照以下步骤进行安装。否则,跳到下一节以验证您的 Docker 安装。建议遵循最新的官方 Docker 安装说明,但为了方便起见,此处复制了 Ubuntu 和 Debian 环境的关键步骤。此外,可以在此处找到安装 NVIDIA Container Toolkit 的步骤,并且也复制如下。
首先,使用安装脚本安装 Docker
$ curl https://get.docker.com | sh \
&& sudo systemctl --now enable docker
接下来,安装 NVIDIA Container Toolkit,它添加了在容器内部使用 NVIDIA GPU 的支持。如果您没有 NVIDIA GPU,则可以跳到下一节。
$ distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
&& curl -s -L https://nvidia.github.io/libnvidia-container/gpgkey | sudo apt-key add - \
&& curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.list | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
接下来,更新您的软件包管理器并安装 nvidia-docker2
$ sudo apt update
$ sudo apt install -y nvidia-docker2
最后,重启 Docker 服务以完成安装
$ sudo systemctl restart docker
默认情况下,Docker 只能通过 root 用户或使用 sudo
以 root 权限执行。要在没有 root 权限的情况下运行 Docker,您需要将所需的用户添加到 docker
组。这可以通过运行以下命令来完成(您可以将 $USER
替换为您工作站上的任何特定用户)
$ sudo usermod -aG docker $USER
将用户添加到 docker
组后,注销并重新登录任何已添加的用户,以使更改生效。完成后,所有指定的用户现在都可以使用 Docker,而无需 root 权限。
NVIDIA GPU 支持已添加到 Docker 版本 19.03。为了使用 GPU 进行测试,您需要运行此版本或更高版本。要检查您的版本,请运行
$ docker --version
如果这显示“Docker version 19.03”或更新版本,则表示您的 Docker 安装受支持。如果显示的版本早于 19.03,请按照上述说明安装最新版本的 Docker,包括必要的 NVIDIA Container Toolkit。