(可选)部署 Jupyter#
本文档是NVIDIA DGX BasePOD:部署指南,以 NVIDIA DGX A100 系统为例的一部分。
Base Command Manager (BCM) 提供了强大且常用的 Jupyter 集成。由于 Jupyter 集成通过 HPC 工作负载管理系统或 Kubernetes 在集群中分发内核,因此 Jupyter 通常安装在头节点或登录节点上。
注意
在完成本文档中的步骤之前,请先完成部署 Slurm。
警告
#
提示符表示您在头节点上以 root 用户身份执行的命令。%
提示符表示您在 cmsh 中执行的命令。
使用 CLI 向导安装 Jupyter#
在头节点上以 root 用户身份运行 cm-jupyter-setup CLI 向导。
1# cm-jupyter-setup
选择“部署”以继续。
指定 JupyterHub 登录节点的覆盖名称和优先级。默认情况下,Jupyter 向导将创建一个名为 jupyterhub 且优先级为 500 的配置覆盖。除非存在现有的 jupyterhub 覆盖,否则请使用默认值。
选择 bcm10-headnode,然后选择“确定”。配置 HA 后,cm-jupyterhub 服务将设置为始终在活动头节点上运行。
选择默认端口 8000、8901 和 8902,然后选择“确定”。用户将通过端口 8000 在活动头节点上访问它。
选择“保存配置并部署”,然后选择“确定”。
选择“确定”以开始安装。默认情况下,Jupyter 向导会将部署配置保存在 /root/cm jupyter setup.conf 中。此配置文件可用于将来重新部署 Jupyter。
安装完成后,cm-jupyter 服务将自动在选定的节点上启动。集群中的所有用户(root 用户除外)都将能够使用 Web 浏览器在
http://<head-node-ip
或FQDN>:8000
登录到 Jupyterhub。示例:http://10.227.52.254:8000
。如果需要,可以使用以下命令创建测试用户
1# cmsh -c "user; add jupyterhubuser; set password jupyterhubuser; commit"
将用户添加到 Kubernetes。
1# cm-kubernetes-setup --add-user jupyterhubuser --operators cm-jupyter-kernel-operator
后续步骤#
完成此页面上的步骤后,您可以配置高可用性。