部署 Docker#

本文档是 NVIDIA DGX BasePOD:部署指南,以 NVIDIA DGX A100 系统为例 的一部分。

在头节点和 K8s 控制平面节点上安装 Docker,以便用户可以在这些节点上使用 Docker 功能,例如构建容器。

注意

在完成本文档中的步骤之前,请完成 开启电源并配置集群节点

警告

# 提示符表示您在头节点上以 root 用户身份执行的命令。% 提示符表示您在 cmsh 中执行的命令。

安装 Docker#

  1. 以 root 用户身份在头节点上运行 cm-docker-setup CLI 向导。

    1# cm-docker-setup
    
  2. 选择 Deploy 以继续。

    _images/docker-2.png
  3. 默认情况下,该向导将创建一个 Docker 配置覆盖。这会将 Docker::Host 角色分配给向导中选择的节点。

    _images/docker-3.png
  4. 在屏幕中将项目保持未选中状态,因为将在下一步中指定各个节点。

    _images/docker-4.png
  5. 已选择 bcm10-headnode 以安装 Docker。

    _images/docker-5.png
  6. (可选)指定特定的 Docker 桥接网络。如果您选择不指定桥接网络,将使用默认值 172.17.0.0/16。

    _images/docker-6.png
  7. 在下一个屏幕上输入任何本地 Docker 存储库。

    _images/docker-7.png
  8. 由于头节点上没有 GPU,请勿在头节点上安装 NVIDIA Container Runtime。

    _images/docker-8.png
  9. 选择 Save config & deploy 以保存部署配置。

    _images/docker-9.png
  10. 默认情况下,Docker 向导会将部署配置保存在 /root/cm docker setup.conf 中。此配置文件可用于将来重新部署 Docker。选择 Ok 以开始安装。

后续步骤#

完成此页面上的步骤后,请参阅 部署 Kubernetes