步骤 #1:设置 Docker
在开始之前,需要在本地工作站上安装 Docker,以便可以拉取、运行、修改容器并推送到 NGC。这假定您在工作站上运行的是基于 Linux 的现代操作系统,并且具有外部互联网访问权限以及具有 root 或 sudo 权限的用户。以下命令显示的是使用 sudo 而不是 root。理想情况下,最好至少安装一个 NVIDIA GPU 以及最新的驱动程序。
如果您的工作站上未安装 Docker,您可以按照以下步骤进行安装。否则,请跳至下一节以验证您的 Docker 安装。建议遵循最新的官方 Docker 安装说明,但为了方便起见,此处复制了 Ubuntu 和 Debian 环境的关键步骤。此外,有关安装 NVIDIA Container Toolkit 的步骤,请参见此处,并且也复制如下。
首先,使用安装脚本安装 Docker
$ curl https://get.docker.com | sh \
&& sudo systemctl --now enable docker
接下来,安装 NVIDIA Container Toolkit,它增加了在容器内使用 NVIDIA GPU 的支持。如果您没有 NVIDIA GPU,则可以跳至下一节。
$ distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
&& curl -s -L https://nvidia.github.io/libnvidia-container/gpgkey | sudo apt-key add - \
&& curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.list | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
接下来,更新您的软件包管理器并安装 nvidia-docker2
$ sudo apt update
$ sudo apt install -y nvidia-docker2
最后,重启 Docker 服务以完成安装
$ sudo systemctl restart docker
默认情况下,Docker 只能使用 root 权限执行,要么作为 root 用户,要么通过使用 sudo
。要以非 root 身份运行 Docker,您需要将所需用户添加到 docker
组。这可以通过运行以下命令来完成(您可以将 $USER
替换为您工作站上的任何特定用户)
$ sudo usermod -aG docker $USER
将用户添加到 docker
组后,注销并重新登录任何已添加的用户,以使更改生效。完成后,所有指定用户现在都可以使用 Docker,而无需 root 权限。
NVIDIA GPU 支持在 Docker 版本 19.03 中添加。为了使用 GPU 进行测试,您需要运行此版本或更高版本。要检查您的版本,请运行
$ docker --version
如果显示“Docker version 19.03”或更高版本,则您的 Docker 安装受支持。如果显示的版本早于 19.03,请按照上述说明安装最新版本的 Docker,包括必要的 NVIDIA Container Toolkit。