部署 NVIDIA AI Enterprise 容器#

  1. 使用您的 NGC 密钥创建镜像拉取密钥

    oc create secret docker-registry regcred --docker-server=nvcr.io/nvaie --docker-username=\$oauthtoken --docker-password=<YOUR_NGC_KEY> --docker-email=<your_email_id> -n default
    
  2. 应用访问 NVAIE Jupyter Notebook 的自定义 yaml 文件

    在此示例中,利用 TensorFlow 容器启动 Jupyter Notebook。创建一个新的 yaml 文件,内容如下,命名为 tensorflow.yaml

    警告

    <NVAIE-MAJOR-VERSION>:<NVAIE-CONTAINER-TAG> 中填写版本和标签。示例:2-3:22.09-tf2-nvaie-2.3-py3

     1apiVersion: apps/v1
     2kind: Deployment
     3metadata:
     4name: tensorflow-jupyter-notebook
     5labels:
     6    app: tensorflow-jupyter-notebook
     7spec:
     8replicas: 1
     9selector:
    10    matchLabels:
    11    app: tensorflow-jupyter-notebook
    12template:
    13    metadata:
    14    labels:
    15        app: tensorflow-jupyter-notebook
    16    spec:
    17    containers:
    18    - name: tensorflow-container
    19        image: nvcr.io/nvaie/tensorflow-<NVAIE-MAJOR-VERSION>:<NVAIE-CONTAINER-TAG>
    20        ports:
    21        - containerPort: 8888
    22        command: ["jupyter-notebook"]
    23        args: ["--NotebookApp.token=''"]
    24        resources:
    25        requests:
    26            nvidia.com/gpu: 1
    27        limits:
    28            nvidia.com/gpu: 1
    29    imagePullSecrets:
    30    - name: regcred
    31---
    32kind: Service
    33apiVersion: v1
    34metadata:
    35name: tensorflow-jupyter-notebook
    36spec:
    37type: NodePort
    38selector:
    39    app: tensorflow-jupyter-notebook
    40ports:
    41- protocol: TCP
    42    nodePort: 30040
    43    port: 8888
    44    targetPort: 8888
    

    警告

    在生产部署中,利用路由而不是节点端口。有关路由创建,请参考 Red Hat 路由配置文档

    运行以下命令以应用 yaml 文件。

    oc apply -f tensorflow.yaml
    
  3. 访问 Jupyter Notebook

    Pod 启动后,使用以下命令描述它

    oc describe pod tensorflow-jupyter-notebook-6c87cb86f7-9hvpm
    

    记下它运行所在节点的 FQDN 或 IP,并构建用于访问 Notebook 的 URL。

    http://<NODE_FQDN_OR_IP>:30040
    

    注意

    有关使用 OpenShift 启动 Jupyter Notebook 的更多信息,请参阅 Using Jupyter Project Images 博客。更多示例可以在 Jupyter-Stack OpenShift Exampels Gitlab 页面中找到。