NVIDIA AI Enterprise VMI#

在 4.1 版本中添加。

NVIDIA AI Enterprise 按需 VMI 通过 CSP 市场提供,这些市场可以轻松访问 NVIDIA AI Enterprise 容器、模型、资源和支持,而无需单独的许可证。这些企业级 VMI 包含运行 NVIDIA AI Enterprise 容器所需的所有软件。

注意

为了运行 NVIDIA AI 工作流程,必须在企业级 VMI 上安装 NVIDIA Cloud Native Stack。有关通过 Ansible playbook 在企业级 VMI 上安装 Cloud Native Stack 的说明,请参阅 NVIDIA AI 工作流程部署指南。有关安装 CNS 的更多详细信息,请参阅 CNS Playbook。为了避免这些额外的步骤,也可以使用 Cloud Native Stack VMI,但目前 NVIDIA AI Enterprise 不支持该 VMI。有关 NVIDIA AI 工作流程的更多信息,请参阅通用的 NVIDIA AI Enterprise 文档

NVIDIA AI Enterprise 按需 VMI 是一个虚拟机镜像,用于加速您的机器学习、深度学习、数据科学和 HPC 工作负载。使用此 VMI,您可以在几分钟内启动一个 GPU 加速的 Compute Engine VM 实例,其中预装了 Ubuntu 操作系统、GPU 驱动程序、Docker 和 NVIDIA 容器工具包。

此 VMI 可以轻松访问 NVIDIA 的 NGC Catalog,这是一个 GPU 优化软件中心,用于拉取和运行性能调优、测试和 NVIDIA 认证的 Docker 容器。NGC Catalog 提供对容器化的 AI、数据科学和 HPC 应用程序、预训练模型、AI SDK 和其他资源的免费访问,使数据科学家、开发人员和研究人员能够专注于构建和部署解决方案。按需 VMI 预配置了以下软件

  • 经 NVIDIA AI Enterprise 认证的 Ubuntu 操作系统

  • NVIDIA 驱动程序

  • Docker-ce

  • NVIDIA 容器工具包

  • CSP CLI、NGC CLI

  • Miniconda、JupyterLab、Git

  • 令牌激活脚本

注意

当 NVIDIA vGPU 驱动程序预装时,它被配置为计算工作负载。

完整的支持实例类型列表可以在 NVIDIA AI Enterprise 产品支持矩阵中找到。

访问 NGC 上的 NGC Catalog#

在企业级(按需)VMI 云实例中开始使用 NVIDIA AI Enterprise 之前,您必须使用 NVIDIA NGC 授权该实例。作为 VMI 按需实例的一部分,提供了一个实例 ID 令牌,需要将其复制到 NGC 上的“激活订阅”页面。企业级 VMI 提供对 NVIDIA AI Catalog 至少十五天的访问权限,但用户必须首先获取适当的 API 密钥并将其放置在 VMI 上。

注意

有关在公有云中设置 VMI 的更多信息,请参阅 NGC 认证公有云文档

此过程包含四个高级步骤。

  1. 从 VMI 获取身份令牌。

  2. 使用令牌激活您的 NVIDIA AI Enterprise 订阅。

  3. 生成用于访问 Catalog 的 API 密钥。

  4. 将 API 密钥放在 VMI 上。

  1. 从 VMI 获取身份令牌

    VMI 有一个 shell 脚本,可以从 VM 元数据中获取令牌。

    SSH 进入 VM 并验证您是否在用户的主目录 ${HOME} 中。

    运行带有 -g 参数的脚本以查看 NGC 令牌。

    ./ngc-token.sh -g
    

    保存终端中的令牌,以便复制到 NGC 中。

    注意

    生成的令牌在一个小时后过期

  2. 使用令牌激活您的 NVIDIA AI Enterprise 订阅

    从 VM 元数据中获取的令牌允许您通过 NGC 门户激活 NVIDIA AI Enterprise。

    直接通过 https://org.ngc.nvidia.com/activate 访问激活页面

    如果出现提示,请使用您的电子邮件地址和密码登录 NGC。

    激活订阅页面上,使用您公司总部的地址输入您的业务信息。

    将令牌粘贴到令牌字段中,然后选择激活订阅

    _images/cloud-01.png

    系统验证您的信息和令牌后,查看显示的信息并选择激活订阅

    _images/cloud-02.png

    您的订阅现已激活。

  3. 生成用于访问 Catalog 的 API 密钥

    接下来,您必须生成一个 API 密钥,该密钥将使您能够访问 NGC Catalog。

    导航到右上角的用户帐户图标,然后选择设置

    _images/cloud-03.png _images/cloud-04.png

    选择获取 API 密钥以打开“设置” > “API 密钥”页面。

    选择生成 API 密钥以生成您的 API 密钥。

    选择确认以生成密钥,并从页面底部复制它。NGC 不会保存您的密钥,因此请将其存储在安全的地方。

    _images/cloud-05.png

    注意

    生成新的 API 密钥会使先前生成的密钥失效。

  4. 将 API 密钥放在 VMI 上

    API 密钥允许您从 NVIDIA Catalog 中拉取资源,但您必须使其可用于不同的工具,例如 Docker 和 NGC CLI。

    将 API 密钥添加到 NGC CLI

    ngc config set
    

    输入 API 密钥

    接下来,将 API 密钥添加到 Docker CLI

    docker login --username "\$oauthtoken" --password <API-KEY> nvcr.io
    

    VMI 现在已准备好拉取和运行 NVIDIA AI Enterprise 容器。

拉取和运行 NVIDIA AI Enterprise 容器#

请参阅附录,了解如何通过 NVIDIA NGC Catalog 拉取和运行 NGC 容器镜像。

维护对 NVIDIA AI NGC Catalog 的访问权限#

在前几个步骤中生成的 API 密钥提供对 NGC Catalog 最多十五天的访问权限。通过使用不同的参数运行 shell 脚本,可以为同一 API 密钥续订此访问权限再延长十五天。

SSH 进入 VM 并验证您是否在用户的主目录 ${HOME} 中。

运行带有 -n 参数的脚本。

./ngc-token.sh -n

警告

VMI 实例 ID 与关联的 NGC 组织之间存在一对一的关系。这意味着,如果您删除 VMI,则 NGC Org 将无法再续订(访问权限将保持到当前 15 天到期为止)。

注意

NVIDIA AI Enterprise 附带的 NGC 上典型私有容器注册表的授权包含在企业级按需 VMI 中。

注意

企业级按需 VMI 许可不允许管理员将其他用户添加到与其 VMI 关联的 NGC Org。

注意

为了从新的运行实例续订订阅,用户需要通过 UI 激活流程激活新实例(生成新的实例令牌)。

NVIDIA 技术支持资源#

以下技术支持资源可用于 NVIDIA AI Enterprise

开发者论坛

有关作为 NVIDIA AI Enterprise 一部分提供的 AI 应用程序框架和 SDK 的常见问题和信息,请访问 NVIDIA 开发者论坛

按需使用 NVIDIA AI Enterprise VMI 的电话支持

在 OCI 市场上按需使用 NVIDIA AI Enterprise VMI 的客户可以免费向 NVIDIA 提交最多 3 个技术支持请求。要与 NVIDIA 支持专家联系,请拨打 此处列出的电话号码之一,并在请求帮助时提供代码 OCI-NVAIE。

当作为私有报价订购时,NVIDIA AI Enterprise VMI 的 NVIDIA 业务标准支持

通过私有报价对 NVIDIA AI Enterprise 做出长期承诺的客户有权获得 NVIDIA 业务标准支持。NVIDIA 业务标准支持包括

  • 24x7 在线支持门户,可访问用于错误报告和问题解决的跟踪工具、知识库材料和故障排除信息。

  • 当地时区工作日上午 8 点至下午 5 点的电话技术协助。

有关私有报价的更多详细信息,请单击此处