(可选)部署 Jupyter#

本文档是NVIDIA DGX BasePOD:部署指南,以 NVIDIA DGX A100 系统为例的一部分。

Base Command Manager (BCM) 提供了强大且常用的 Jupyter 集成。由于 Jupyter 集成通过 HPC 工作负载管理系统或 Kubernetes 在集群中分发内核,因此 Jupyter 通常安装在头节点或登录节点上。

注意

在完成本文档中的步骤之前,请先完成部署 Slurm

警告

# 提示符表示您在头节点上以 root 用户身份执行的命令。% 提示符表示您在 cmsh 中执行的命令。

使用 CLI 向导安装 Jupyter#

  1. 在头节点上以 root 用户身份运行 cm-jupyter-setup CLI 向导。

    1# cm-jupyter-setup
    
  2. 选择“部署”以继续。

    _images/jupyter-2.png
  3. 指定 JupyterHub 登录节点的覆盖名称和优先级。默认情况下,Jupyter 向导将创建一个名为 jupyterhub 且优先级为 500 的配置覆盖。除非存在现有的 jupyterhub 覆盖,否则请使用默认值。

    _images/jupyter-3.png
  4. 选择 bcm10-headnode,然后选择“确定”。配置 HA 后,cm-jupyterhub 服务将设置为始终在活动头节点上运行。

  1. 选择默认端口 8000、8901 和 8902,然后选择“确定”。用户将通过端口 8000 在活动头节点上访问它。

    _images/jupyter-5.png
  2. 选择“保存配置并部署”,然后选择“确定”。

    _images/jupyter-6.png
  3. 选择“确定”以开始安装。默认情况下,Jupyter 向导会将部署配置保存在 /root/cm jupyter setup.conf 中。此配置文件可用于将来重新部署 Jupyter。

    _images/jupyter-7.png
  4. 安装完成后,cm-jupyter 服务将自动在选定的节点上启动。集群中的所有用户(root 用户除外)都将能够使用 Web 浏览器在 http://<head-node-ipFQDN>:8000 登录到 Jupyterhub。示例:http://10.227.52.254:8000

    _images/jupyter-8.png
  5. 如果需要,可以使用以下命令创建测试用户

    1# cmsh -c "user; add jupyterhubuser; set password jupyterhubuser; commit"
    
  6. 将用户添加到 Kubernetes。

    1# cm-kubernetes-setup --add-user jupyterhubuser --operators cm-jupyter-kernel-operator
    

后续步骤#

完成此页面上的步骤后,您可以配置高可用性