部署 Docker#
本文档是 NVIDIA DGX BasePOD:部署指南,以 NVIDIA DGX A100 系统为例 的一部分。
在头节点和 K8s 控制平面节点上安装 Docker,以便用户可以在这些节点上使用 Docker 功能,例如构建容器。
注意
在完成本文档中的步骤之前,请完成 开启电源并配置集群节点。
警告
#
提示符表示您在头节点上以 root 用户身份执行的命令。%
提示符表示您在 cmsh 中执行的命令。
安装 Docker#
以 root 用户身份在头节点上运行 cm-docker-setup CLI 向导。
1# cm-docker-setup
选择 Deploy 以继续。
默认情况下,该向导将创建一个 Docker 配置覆盖。这会将 Docker::Host 角色分配给向导中选择的节点。
在屏幕中将项目保持未选中状态,因为将在下一步中指定各个节点。
已选择 bcm10-headnode 以安装 Docker。
(可选)指定特定的 Docker 桥接网络。如果您选择不指定桥接网络,将使用默认值 172.17.0.0/16。
在下一个屏幕上输入任何本地 Docker 存储库。
由于头节点上没有 GPU,请勿在头节点上安装 NVIDIA Container Runtime。
选择 Save config & deploy 以保存部署配置。
默认情况下,Docker 向导会将部署配置保存在 /root/cm docker setup.conf 中。此配置文件可用于将来重新部署 Docker。选择 Ok 以开始安装。
后续步骤#
完成此页面上的步骤后,请参阅 部署 Kubernetes。