步骤 3:安装工作流程组件#

鱼叉式网络钓鱼

本节将引导您完成端到端的工作流程部署,使用前面描述的示例软件堆栈组件。

在继续部署步骤之前,请确保已完成之前的步骤 2:设置所需基础设施部分。

  1. SSH 进入集群。

  2. 如果您仍需要使用您的 API 密钥和 NGC Org 信息安装和设置 NGC CLI,请执行此操作以下载工作流程所需的资源。说明请见此处

  3. 根据您的信息设置以下环境变量,如下例所示

    1export NGC_KEY=<YOUR NGC API KEY>
    2export NAMESPACE=<A namespace name, for example, “aiworkflow”>
    3export APP_NAME=<An app name to use within the namespace, for example, “sp”>
    

    这些环境变量的内容将在工作流程的其余部分中被引用。

  4. 使用以下命令将 Helm Chart 拉取到系统上

    helm fetch https://helm.ngc.nvidia.com/nvaie/charts/cybersecurity-sp-0.1.0.tgz --username='$oauthtoken' --password=$NGC_KEY
    
  5. 运行以下 Helm 安装命令以部署应用程序。

    helm install -n $NAMESPACE $APP_NAME ./cybersecurity-sp-0.1.0.tgz --set ngcKey=$NGC_KEY --create-namespace --timeout 3600s
    

    注意

    此安装可能需要几分钟才能完成。

    注意

    此 Helm Chart 假定已安装先前步骤中描述的默认配置,包括 NVIDIA Cloud Native Service Add-on Pack 和 local-path-provisioner。如果集群配置不同,例如创建了不同的存储类,则需要相应地修改 Chart 的 values.yaml 文件。

  6. 几分钟后,使用以下命令检查并验证应用程序是否成功部署

    kubectl get pods -n $NAMESPACE
    

    注意

    您可能会看到一个状态为 Error 的 mlflow-backup Pod。如果另一个 mlflow-backup Pod 的状态为 Completed,这是良性的,可以忽略。

    ../_images/sp-image-pod-list.png
  7. 此时,请继续前往运行工作流程部分以继续。