NVIDIA Base Command Platform 发行说明

简介

NVIDIA Base Command™ Platform 是一个全面的平台,为企业、其数据科学家和 IT 团队而设计,以即用型云托管解决方案的形式提供,用于管理 AI 开发、AI 工作流程和资源管理的端到端生命周期。

本文档记录了与指定 Base Command Platform 版本相关的功能和修复。

版本

本节详细介绍了 NVIDIA Base Command Platform 不同组件的可识别版本。

组件名称

当前版本

NGC Web UI

2.295.1

NGC Base Command Web UI

0.88.2

NGC Catalog Web UI

1.158.1

NGC Org Web UI

0.67.0

NGC Registry Web UI

0.76.1

NGC CLI

3.38.0

Base Command Platform

1.26.7

NGC Batch Worker

1.38.3

NGC Batch Service

1.135.14

组件

本节详细介绍了 NVIDIA Base Command Platform 的不同组件。

组件

子组件

描述

参考

NGC UI

NGC Web UI

此组件指的是 ngc.nvida.com 的主要前端入口点,处理用户身份验证和帐户设置。

_images/bcp-comp-5.png _images/bcp-comp-10.png _images/bcp-comp-8.png

NGC UI

NGC Base Command Web UI

此组件指的是 Base Command Platform Web 应用程序上的“Base Command”部分,用户可以通过它访问平台的仪表板、作业、数据集和工作空间。

_images/bcp-comp-6.png

NGC UI

NGC Catalog Web UI

此组件指的是 Base Command Platform Web 应用程序上的“Catalog”部分,用户可以通过它访问 NVIDIA 和第三方 ISV 提供的用于 AI、HPC 和可视化的软件。

_images/bcp-comp-2.png

NGC UI

NGC Org Web UI

此组件指的是 Base Command Platform Web 应用程序上的“Organization”部分,组织中的用户管理员可以访问该部分。

_images/bcp-comp-3.png

NGC UI

NGC Registry Web UI

此组件指的是 Base Command Platform Web 应用程序上的“Private Registry”部分,用户可以通过它访问 NGC Private Registry,这是一个安全空间,用于在企业内部存储和共享自定义容器、模型、Jupyter 笔记本和 Helm chart。

_images/bcp-comp-1.png

NGC CLI

不适用

此组件指的是用于与 NGC 和 Base Command Platform 组件交互的命令行界面。

_images/bcp-comp-11.png

Base Command Platform

不适用

此组件指的是与 Base Command Platform 关联的功能版本。

NGC Batch

Batch Worker

此组件指的是 NGC Base Command restful 服务,该服务协助资源、工作流程和操作的端到端生命周期。

NGC Batch

Batch Service

此组件指的是 NGC Base Command 服务,该服务与其他服务(如云、存储和计算)交互。

版本

以下是 Base Command Platform 的最新发行说明。

2024 年 2 月 6 日发行版本

NGC CLI 3.38.0

  • 修复: 解决了 NGC CLI ngc registry collection publish 导致缺少“product_name”属性错误的问题。

2024 年 1 月 23 日发行版本

NGC Catalog Web UI v1.148.2

  • 增强功能: 企业 Catalog 托管由 NVIDIA AI Enterprise (NVAIE) 支持的软件,现已集成到 NGC Catalog(公共)中。此统一 Catalog 提供对 NGC 实体(如容器、资源和模型)的不同访问级别。用户可以查看所有授权或公共实体,而无需切换到不同的组织。拥有有效 NVAIE 授权的 NVAIE 客户可以从 NGC Catalog 中访问其专属的软件和功能。

NGC CLI 3.36.1

  • 修复: 解决了在没有标志的情况下以及使用 --invited 标志的情况下,ngc org list-users 错误地包含对组织下团队的邀请的问题。

2023 年 1 月 9 日发行版本

NGC CLI 3.36.0

  • 增强功能: 用户现在可以使用其电子邮件/密码组合通过 Web 浏览器登录 NGC CLI 并开始使用 CLI,从而无需 API 密钥。要为 CLI 访问启用电子邮件身份验证,用户需要在 CLI 中执行 ngc config set --auth-option email。如果浏览器未自动打开,用户可以手动打开 CLI 中提供的链接,使用其凭据登录,然后返回 CLI 完成设置。默认身份验证选项将继续使用 API 密钥:ngc config set 或使用 ngc config set --auth-option api-key 显式设置。

    请注意,通过此身份验证方法获得的会话密钥有效期为 24 小时。在此期限之后,用户必须重新登录才能继续访问。有关更多信息,请参阅 NGC CLI 文档。

2023 年 12 月 12 日发行版本

NGC CLI 3.35.0

  • 修复: 解决了 ngc base-command quickstart project cluster-create 命令的问题。用户现在可以成功地为快速入门项目创建新集群。

  • 增强功能: Data Mover 现在支持以下附加命令

    ngc bc workspace import run:将数据从对象存储(S3 或 OCI 预身份验证 URL)传输到新的工作空间中。

    ngc bc workspace import list:检索所有工作空间导入的列表。

    ngc bc workspace import info <job>:检查单个导入的状态。

    这些新命令与现有命令(ngc bc dataset importngc bc dataset exportngc bc workspace export)结合使用,将使用户能够自行在 ACE 之间复制数据集或工作空间。

2023 年 10 月 31 日发行版本

NGC CLI 3.32.0

  • 修复: 用户可以导入不包含名称的工作空间。

  • 修复: 解决了用户尝试使用“ngc version list”列出 NGC CLI 版本时收到 401 错误响应的问题。

2023 年 10 月 17 日发行版本

NGC Base Command Web UI v0.80.2

  • 修复: 解决了在启动快速入门作业后,生成的 NGC CLI 命令 ngc base-command quickstart cluster create 包含 --workspace-mount 选项的错误值的问题。

  • 增强功能: 改进了数据集创建的成功消息,以提供更多信息,包括已创建数据集的 UUID 及其关联的 ACE。

NGC Catalog Web UI v1.108.0

  • 修复:Catalog > Containers下,将安全扫描结果标签从“(最新) 扫描结果”更新为“(最新) 安全扫描结果”。

  • 增强功能: 增加了对容器扫描的支持,包括 SBOM(软件物料清单)作为可下载文件,以及 VEX 用于从容器安全扫描问题列表中过滤非问题。

NGC Registry Web UI v0.57.8

  • 修复:Catalog > Containers下,将安全扫描结果标签从“(最新) 扫描结果”更新为“(最新) 安全扫描结果”。

NGC CLI 3.31.0

  • 修复: 解决了上传到在端口 443 上配置了 gRPC 的 ACE 的问题。

  • 修复: 解决了添加到作业运行命令的标签未传递到启动的作业的问题。

2023 年 10 月 3 日发行版本

NGC Base Command Web UI v0.77.11

  • 修复: 在组织之间切换的用户将在仪表板上看到与组织关联的正确 ACE存储配额

  • 修复: 解决了 Quick Start Dask & RAPIDS 作业的最大工作程序数量不正确,阻止用户根据需要添加或删除工作程序的问题。

NGC Catalog Web UI v1.103.2

  • 增强功能: 用户将能够在表格视图中查看模型列表时下载模型。

NGC Registry Web UI v0.57.4

  • 修复: 用户可以在 Private Registry 中上传最大 5 TB 大小的文件。

2023 年 9 月 19 日发行版本

此版本引入了以下 Base Command Platform 增强功能

  • Base Command Platform 的新 NGC CLI 命令语法

    ngc batch 命令已替换为 ngc base-command 或简写 ngc bc。请注意,旧的 ngc batch 命令现已弃用,将在未来的版本中逐步淘汰。有关更多信息,请参阅 NGC CLI 文档

NGC Registry Web UI v0.56.4

  • 增强功能: 用户现在可以上传耗时超过 24 小时才能完成的文件。

NGC CLI 3.29.0

  • 修复: 显示 ngc diag allngc diag install 命令的 Docker 相关问题的错误消息。

  • 修复: 在运行 NGC CLI 命令 ngc org list-users 和 ngc team list-users 以检索组织和团队用户列表时,将结果列使用的登录方式重命名为登录方法

  • 增强功能: 用户在使用 S3 端点导入或导出资源时,将能够指定前缀。

  • 增强功能: NGC CLI 子命令 add-userupdate-user 在指定无效角色时将返回错误消息。要查看可用角色列表,请对相应命令使用 -h 选项,例如 ngc org add-user -hngc team update-user -h

  • 增强功能: ngc version info 命令将显示当前的 NGC CLI 版本,以及是否有可用更新版本。

  • 增强功能: 可以通过 NGC CLI 访问 Base Command Platform 快速入门功能。有关更多信息,请参阅 NGC CLI 文档。

2023 年 9 月 5 日发行版本

Base Command Platform v1.25.5

此版本引入了以下 Base Command Platform 功能

  • 快速入门

    快速入门功能使 Base Command Platform 用户只需单击一下鼠标即可直接从仪表板启动交互式 JupyterLab 会话。用户可以从模板开始,快速配置实例详细信息(如 GPU 和 CPU),添加数据集或工作空间,或更改容器,从而简化从仪表板开始的工作流程。

    用户还可以访问用于快速启动与 Dask 和 RAPIDS 的交互式会话的模板,从而使用户能够立即访问 RAPIDS 库,这是一个开源 GPU 加速数据科学库的集合。此外,Dask 允许用户有效地跨多个 GPU 扩展工作负载。

    拥有组织级 BASE_COMMAND_ADMIN 角色的管理员可以创建和更新其组织可以访问的模板。要开始使用,请登录 NGC,然后从左侧导航菜单中单击Base Command > 仪表板

    有关更多信息,请参阅 快速入门作业

  • 工作空间 SFTP 访问

    Base Command Platform 工作空间现在可以更轻松地与 SFTP 兼容工具互操作,从而为 BCP 环境中的存储轻松提供标准且安全的访问方法。用户现在可以利用 NGC CLI 查询工作空间并公开端口、主机名和令牌,以便与 SFTP 客户端一起使用。运行带有 --show-sftp 标志的 ngc base-command workspace info 将返回通过 SFTP 与工作空间通信所需的所有信息,以及用于 SFTP CLI 工具的示例命令。此新功能与标准 Linux、WSL 和 MacOS SFTP 工具兼容。

    有关更多信息,请参阅 使用 SFTP 访问工作空间

  • bcprun 日志记录增强功能

    我们改进了 bcprun 作业输出、joblog.log 和 STDOUT/STDERR 的日志记录行为。对于“PYTORCH”数组类型作业,STDOUT 和 STDERR 日志将写入作业结果目录中每个节点、每个等级的单独文件中。用户可以在 NGC Web UI 中查看这些日志,或使用 CLI 下载它们。

    有关更多信息,请参阅 Base Command Platform 用户指南中的 管理结果。对于多节点作业,bcprun 有两个新选项可用

    • -d--debug 将调试 bcprun 执行语句打印到 joblog.log。

    • log--logdir 覆盖默认日志位置。仅适用于数组类型为“PYTORCH”的作业。

    有关这些参数的更多信息,请参阅 使用 bcprun 启动多节点作业

  • 端口 443 上的 NGC FSS

此功能旨在通过允许客户从其企业网络打开更少的出站端口来简化客户入门。此增强功能使 FSS 的数据平面流量能够在行业标准端口 443 而不是 443、7565 和 9001 上运行。用户无需执行任何操作,只需利用正确版本的 CLI 即可。

NGC Base Command Web UI v0.77.0

  • 增强功能: 添加了快速入门,这是一项新的 Base Command Platform 功能,允许管理员创建和管理作业模板,以便快速轻松地启动作业。

NGC Catalog Web UI v0.55.5

  • 修复: 解决了 Catalog Web UI 中多个标签产生不正确的过滤结果的问题。

NGC CLI 3.27.0

  • 增强功能: 添加了使用 NGC CLI 命令显示工作空间安全文件传输协议 (SFTP) 信息的功能

    $ ngc workspace info <workspace> --show-sftp
    

2023 年 8 月 22 日发行版本

NGC Web UI v2.287.0

  • 增强功能: 用户可以选择使用 Windows 64 位安装程序安装 NGC CLI。

NGC Base Command Web UI v0.72.4

  • 修复: 解决了作业表中未填充新作业状态的问题。

NGC Registry Web UI v0.55.5

  • 修复: 用户将能够向模型或资源添加最大 1 TB 大小的文件。

  • 修复: 用户现在可以使用实体级和文件浏览器级页面上下载下拉菜单中的 wget 命令来检索资源和模型。

NGC CLI 3.26.0

  • 修复: 使用 --file 标志下载单个文件现在会将文件下载到工作空间文件夹,而不会保留工作空间中的文件夹目录结构。

  • 增强功能: 用户现在在使用 NGC CLI 导入数据集时可以添加自定义元数据。

  • 增强功能: 上传多部分文件时,将仅重新上传失败的部分,而不是整个文件,从而提高不可靠连接的速度。

2023 年 8 月 8 日发行版本

NGC Web UI v2.286.2

  • 修复: 解决了 AMD64 Linux CLI 下载的问题。

NGC Registry Web UI v0.53.5

  • 修复: 解决了具有团队访问权限但没有组织访问权限的用户无法在 Private Registry 中查看团队级实体的问题。

2023 年 7 月 25 日发行版本

NGC Base Command Web UI v0.66.0

  • 修复: 当用户使用文件浏览器列出数据集或工作空间中 100 个或更多文件时,他们将看到一条横幅消息,提示他们使用 CLI 进行文件显示。

NGC Catalog Web UI v1.71.1

  • 修复: 未经身份验证的用户访问 NGC Catalog 中的页面将在登录后被重定向回他们尝试访问的原始页面。

NGC CLI 3.25.0

  • 增强功能

    标签已添加到 Data Mover 作业中,以便于搜索

    • 所有 Data Mover 作业都将具有标签 _nvsvc_datamover_job

    • 所有 Data Mover 作业都将具有一个附加标签,说明 Data Mover 作业的类型。此标签将是以下三个选项之一

      • _nvsvc_datamover_dataset_import

      • _nvsvc_datamover_dataset_export

      • _nvsvc_datamover_workspace_export

NGC Model Service and Worker v1.65.1

  • 增强功能: 已将校验和添加到注册表的下载响应中,以便用户可以验证文件的完整性。

2023 年 7 月 10 日发行版本

NGC Base Command Web UI v0.63.0

  • 修复: 具有 NVIDIA AI Enterprise (NVAIE) 正确访问权限的用户现在可以在Base Command > 创建作业下创建作业时选择这些容器。

NGC Catalog Web UI v1.65.1

  • 增强功能: 从模型和资源下载单个文件将不再需要压缩,从而加快下载体验,并提供暂停或恢复选项。

  • 增强功能: 从 Catalog 下载文件时,下载进度条现在将更频繁地更新。

NGC Registry Web UI v0.52.2

  • 增强功能: 从注册表下载文件时,下载进度条现在将更频繁地更新,表明下载正在进行中,而不是停滞不前。

NGC CLI 3.24.1

  • 修复: 在 Windows Git Bash 上运行时,运行 ngc version upgrade 将不再冻结。

NGC Batch Worker v1.25.3

  • 修复: 解决了作业状态在作业状态更改时不会更新的问题。

2023 年 6 月 27 日发行版本

NGC Catalog

  • 增强功能: 从 2023 年 7 月开始,NGC Catalog 上发布的所有 NVIDIA 容器映像都将进行签名,从而提供用于建立信任、验证映像来源和确保完整性的标准机制。有关更多信息,请参阅 NGC Catalog 中的 NVIDIA 签名容器映像

  • 增强功能: 添加了容器标签的排序和搜索功能。

NGC CLI 3.24.0

  • 修复: Windows CLI 现在在上传文件时将反斜杠替换为正斜杠。这允许 Private Registry 应用程序正确显示其文件夹中的文件。

  • 增强功能: 添加了“使用的登录方式”列,以列出每个用户的登录方法。

2023 年 6 月 13 日发行版本

Base Command Platform v1.25.0

此版本在 Base Command Platform 上引入了三个新功能

  • Data Mover

    Data Mover 允许用户从对象存储导入数据作为指定 ACE 存储中的数据集,并将 ACE 中数据集和工作空间中的数据导出到对象存储。

    可以使用 NGC CLI (3.23.0 或更高版本)从 S3 和 OCI 对象存储导入和导出数据。为此,您必须使用特定密钥在 Base Command Platform 用户指南中的 NGC Secrets 中进行设置。

    先决条件

    1. NGC CLI 版本 3.23.0 或更高版本。

    2. 拥有一个名为“ngc”且密钥为:“ngc_api_key”的密钥。

    3. 对于 S3 实例,密钥为“aws_access_key_id”和“aws_secret_access_key”的密钥。

      注意:任何 S3 兼容实例都适用。

    4. 对于预身份验证 URL(今天在 OCI 上),密钥名称为:“oci_preauth_url”的密钥。

      注意:有关预身份验证 URL 的更多信息,请参阅 OCI - 使用预身份验证请求

    Data Mover 功能支持的功能包括

    1. dataset import {finish, info, list, start}

    2. dataset export {info, list, run}

    3. workspace export {info, list, run}

    有关更多信息,请参阅 导入和导出数据集

NGC Base Command Web UI v0.52.0

  • 增强功能: 作业概览页面已重新设计,具有全新的外观和感觉,同时保留了其现有功能。

  • 改进: 未经身份验证的用户访问 NGC 中的页面将在登录后被重定向回他们尝试访问的原始页面。

NGC Catalog Web UI v1.63.3

  • 增强功能: 作为 Private Registry 中多个大型文件上传功能的一部分(见下文),用户将看到一个新的下载 UI,该 UI 将文件捆绑到一个 zip 文件中。

NGC Registry Web UI v0.50.4

  • 修复: 用户在为模型和资源创建版本时将预先选择正确的版本。

  • 修复: 解决了阻止用户查看模型文件浏览器中所有文件的问题。用户现在可以在文件浏览器中看到整个文件列表。

  • 修复: 解决了用户在为一个资源创建版本后看不到上传文件选项的问题。

  • 增强功能: 用户将能够在 Private Registry 中一起上传多个大型文件。用户还将看到一个新的下载 UI,该 UI 将文件捆绑到一个 zip 文件中。

NGC CLI 3.23.0

  • 修复: 解决了用户会看到有关其数据集和工作空间上传的可用存储空间的不正确信息的问题。

  • 功能: 添加了 Data Mover,这是一项新功能,使用户能够使用 NGC CLI 从 S3 和 OCI 对象存储导入和导出数据集。

    Data Mover 支持以下命令

    • dataset import {finish, info, list, start}

    • dataset export {info, list, run}

    • workspace export {info, list, run}

    导入命令允许用户

    • ngc dataset import start 从对象存储(S3 或 OCI 预身份验证 URL)传输数据

    • ngc dataset import list 检索所有导入的列表,方法是使用

    • ngc dataset import info <job> 检查单个导入的状态,方法是使用

    • ngc dataset import finish <job> 完成导入(将结果转换为数据集),方法是使用

    导出命令实现将数据从 ACE 传输到对象存储

    • ngc dataset export run 将数据集从 ACE 传输到对象存储(S3 或 OCI 预身份验证 URL)

    • ngc workspace export run 将工作空间从 ACE 传输到对象存储(S3 或 OCI 预身份验证 URL)

    命令 ngc dataset export infongc workspace export info 输出导出作业的状态。ngc dataset export listngc workspace export list 打印出用户创建的所有导出作业。

  • 增强功能: 用户可以直接从 S3 查看其模型和资源版本下载。他们还将看到进度条,而不是基于线程的下载状态。

2023 年 5 月 30 日发行版本

Base Command Platform v1.24.6

我们很高兴宣布 Secrets Management Service (SMS),这是一项新功能,供用户安全地维护其在 NGC 中的密钥。NGC Secrets 是一个安全的保管库/存储库,用于存储敏感信息,从而可以轻松地识别外部系统并进行身份验证。

在启用密钥管理的情况下,SMS 可从 NGC 设置页面和 NGC CLI(3.21.1 及更高版本)访问,供用户按组织按产品使用。要使用此功能,组织必须启用密钥管理。

SMS 当前已与 Base Command Platform (BCP) 作业集成。在启用密钥的组织中,用户可以在创建作业时注入其密钥。

NGC Base Command Web UI v0.47.2

  • 修复: 作业创建表单中的清除按钮将清除选定的协议选项。

  • 修复:Base Command > 创建作业页面上创建多节点作业时,用户无需从节点拓扑字段中进行选择。

  • 修复:数据输出面板中结果挂载点字段的默认值设置为“/results”。

  • 增强功能: 容器现在将根据选定的映像标签和选定的 ACE 实例进行验证。

NGC CLI 3.22.0

  • 修复: 解决了与工作空间和数据集上传相关的问题,即上传未完成。

  • 修复: 用户可以查看和交互与具有 100 多个标签的容器关联的所有标签,而不是仅限于前 100 个标签。

  • 增强功能: 在 NGC CLI 中支持密钥管理。

2023 年 5 月 16 日发行版本

NGC Base Command Web UI v0.40.1

  • 修复: 添加了其他文本,以帮助用户区分仪表板上“存储配额”中显示的 ACE。

NGC Registry Web UI v0.46.4

  • 增强功能: 用户可以通过单击文件浏览器中的查看笔记本来查看 Jupyter 笔记本。

NGC CLI 3.21.1

  • 修复: 解决了正在运行的作业的日志命令的问题。

2023 年 5 月 2 日发行版本

NGC Web UI v2.283.0

NGC Base Command Web UI v0.38.11

  • 修复: 解决了系统正在终止总运行时为零 (0) 的作业的问题。

  • 修复: 解决了在团队上下文中创建作业的用户无法查看其父组织的容器的问题。

  • 修复: 用户可以访问系统终止的作业的详细信息页面中的作业日志。

  • 修复: 解决了用户输入的无效搜索查询会导致错误,并且无法清除无效过滤器的问题。用户现在可以清除无效搜索查询的搜索过滤器。

NGC Registry Web UI v0.42.1

  • 增强功能: 用户将能够复制 NVIDIA 公钥的路径以用于签名容器。

  • 增强功能: 用户将看到容器详细信息页面上是否容器具有签名映像。

NGC CLI 3.21.0

  • 修复: 解决了作业结果下载的 --exclude--dir 标志的问题。用户现在可以过滤他们想要从结果中下载的文件和目录。

  • 修复: 当使用具有 100 多个标签的容器时,用户现在可以使用所有标签,而不仅仅是前 100 个标签。

2023 年 4 月 18 日发行版本

NGC Web UI v2.282.7

  • 修复: 当 BYO IDP 规则在用户完成其个人资料后应用于他们时,将授予用户团队的角色/访问权限。

NGC Base Command Web UI v0.38.2

  • 修复: 用户现在在创建和共享工作空间时将看到更简洁的 UI,在创建作业时选择下拉菜单中当前选定的 ACE,并且在给定时间仅打开一个状态历史记录折叠面板。

  • 增强功能: 创建作业时,运行时限制基于所选的 ACE 设置。

NGC Catalog Web UI v1.56.27

  • 修复: 无论用户是否登录,NGC Catalog 首页横幅都可以关闭。

  • 修复: 解决了与 NGC Catalog 中的内容显示相关的问题。

  • 修复: 用户可以了解更多关于 NGC Catalog 中容器的安全扫描的信息。

NGC Org Web UI v0.34.1

  • 修复: 待处理邀请列表可以根据表格中的“邀请日期”列进行排序。

  • 增强功能: 组织所有者可以在仪表板页面上看到“外部 IdP”菜单项。

NGC Registry Web UI v0.39.5

  • 修复: 解决了容器安全扫描问题。

NGC CLI 3.20.0

  • 修复: 解决了具有 BASE_COMMAND_VIEWER 角色的用户列出团队工作空间或数据集的问题。

  • 修复: 解决了与同时上传模型和资源相关的问题。

发布日期 2023年4月4日

NGC Base Command Web UI v0.36.0

  • 修复: 解决了频繁重新获取结果文件导致用户与文件浏览器交互中断的问题。

  • 修复: 更新了容器选择占位符文本,以允许在Base Command > 创建作业页面上选择 ACE 实例。

  • 修复: 给定作业的所有者可以执行各种作业操作,而与其其他用户角色无关。

  • 修复: 生成的 CLI 命令将显示已挂载数据集的正确值。此外,作业表单将根据当前选定的 ACE 设置正确的总运行时。

  • 修复: 生成的 CLI 命令现在将呈现拓扑约束 --topology-constraint 的正确值。

  • 修复: 更新了基于角色的访问控制,用于执行诸如设置作业标签类型(例如保留标签)、共享和撤销对工作空间和数据集的访问以及查看作业结果等操作。

  • 修复: 只有具有正确访问权限的用户才能创建工作空间以及共享/撤销对给定工作空间或数据集的访问权限。

  • 修复: 用户可以调整其表格列的大小,并在退出/重新进入页面时保持其作业表格的筛选器状态。

  • 增强功能: 如果尝试访问找不到的资源,用户将看到错误提示。

  • 增强功能: 提示消息现在将持续八秒钟,以便用户有更多时间阅读较长的警报。

NGC Org Web UI v0.28.1

  • 修复: BYO IDP 规则页面仅在 IDP 链接到支持组的组织时对组织所有者可见。

NGC Registry Web UI v0.36.5

  • 修复: 提高了大型文件的上传速度。

  • 修复: 用户在私有注册表概览页面上将不再看到单词在行之间断开。

  • 修复: 用户现在在更多标签模态框中只会看到独立于任何实体类型的标签集。

NGC CLI 3.19.0

  • 修复: 解决了与下载共享数据集相关的问题。

  • 修复: 私有注册表发布者如果创建带有不兼容参数的命令,将看到错误消息。

发布日期 2023年3月16日

NGC Web UI v2.280.2

  • 已修复: 对于以查看者身份登录的用户,Base Command 平台仪表板上的创建作业按钮将被禁用。

  • 已修复: 用户只有在作业状态处于终端状态时(即,当作业不再运行时)才能将作业结果转换为数据集。

NGC Base Command Web UI v0.33.5

  • 已修复: 修复了在Base Command > 创建作业页面上生成的 CLI 命令中 --commandline 字段的拼写错误。

  • 已修复: 具有 Base Command 平台查看者访问权限的用户无法单击仪表板页面的最近作业部分中的创建作业按钮。

  • 已修复: 存储配额部分中的 ACE 下拉菜单现在应根据 ACE 的名称而不是其存储集群描述来显示选项。

  • 已修复: 修复了在创建/克隆作业时工作空间未正确挂载的问题。

  • 已修复: 只有在存在足够的文本时,作业日志现在才应滚动到日志容器的底部。

  • 已修复: 当用户将鼠标悬停在Base Command > 作业页面上的作业的迷你图上时,工具提示将正确显示。

  • 已修复: 修复了克隆和模板化使用旧端口字段的作业时缺少名称的问题。

  • 已修复: 对于给定的操作(例如创建工作空间或删除工作空间),一次只显示一个通知,并且先前的消息将被删除。

  • 已修复: Base Command > 工作空间表将自动以设定的时间间隔获取可用的工作空间,以便任何新创建的工作空间都将显示给用户。

  • 已修复: 用户将看到可用性改进,例如准确的面包屑链接、更易于阅读的占位符文本以及对较小浏览器窗口的更好支持。

  • 已修复: 时间片和运行时将默认为并允许 0(零)值。

  • 已修复: 仅当表单已被修改时才启用创建作业按钮。

  • 增强功能: 现在将根据选定的镜像标签和选定的 ace 实例验证容器。

NGC Org Web UI v0.27.1

  • 已修复: 改进了访问控制,以确保现在禁用不允许的组织团队/用户操作。

NGC CLI 3.17.0

  • 已修复: Windows 用户可以上传大型文件用于资源和模型。

发布日期 2023年3月7日

NGC Web UI v2.276.0

  • 已修复: 解决了从表格视图克隆作业导致缺少值(例如容器镜像)的问题,从而导致新创建的作业出现问题。用户现在应该能够成功地从表格视图克隆作业,并包含重新运行所需的必要数据。

  • 已修复: 解决了重置克隆作业的 ACE 运行时的问题。

NGC CLI 3.16.0

  • 已修复: 解决了与 ngc batch job exec 命令的警告消息相关的问题。

  • 已修复: 解决了在数组作业上运行 ngc batch attach 的问题。

  • 已修复: 解决了即使作业已完成并且需要强制退出 (CTRL-C) 会话,CLI 也不退出 shell 会话的问题。

NGC Batch Worker v1.15.0

  • 已修复: 解决了作业删除后结果集使用的空间计算问题。

发布日期 2023年2月21日

NGC Web UI v2.275.7

  • 已修复: 为未正确下载遥测 CSV 数据的批处理作业提供支持。

NGC Org Web UI v0.26.8

  • 已修复: 解决了没有足够权限的用户可以看到团队操作的问题。

  • 已修复: 解决了用户表格中的移除用户操作卡在禁用状态的问题。

  • 已修复: 用户将能够按列标题而不是仅按属性名称过滤列。

NGC CLI 3.15.0

  • 已修复: 用户可以 JSON 格式列出结果集文件。

  • 已修复: 使用 ngc registry model upload-version --source 作为单个文件进行上传现在将正确返回文件计数和大小。

  • 已修复: 使用 ngc registry resource upload-version 上传模型和资源版本对于大型文件将不再超时。

  • 增强功能: 在调度作业之前验证实例和镜像架构是否匹配。

发布日期 2023年2月7日

NGC Web UI v2.275.2

  • 已修复: 在 Web 应用程序上显示当前 NGC 版本。

  • 已修复: 改进了在作业创建期间搜索数据集和工作空间的用户体验。

  • 已修复: 显示多节点作业的 InfiniBand 遥测数据。

  • 已修复: 解决了用户可能不会从组织/团队选择页面自动重定向的问题。

  • 已修复: 解决了 Safari 中选择您的组织/团队损坏的问题。

  • 已修复: 解决了并非所有多节点类型作业都可访问 joblogs 的问题。

  • 增强功能: 改进了组织启动页面上的组织和团队选择。

NGC Org Web UI v0.26.4

  • 已修复: 当用户没有在组织内创建团队的适当权限时,创建团队按钮现在被禁用。

NGC CLI 3.14.1

  • 已修复: 如果用户尝试上传任何文件大于最大允许文件大小(当前为 1TiB)的模型或资源,他们将收到警告。

NGC Batch Service v1.44.8

  • 已修复: 允许在更新 ACE 时存储卷为空。

发布日期 2023年1月24日

NGC Org Web UI v0.26.1-r3

  • 已修复: 显示应用程序名称以及版本。

NGC CLI 3.13.0

  • 已修复: 解决了单节点作业的无效数组类型参数未被标记的问题。

  • 已修复: 当运行 ngc diag allngc diag server 时,输出现在将包括到 Helm chart 存储库的连接性检查。

NGC Batch Service v1.44.8

  • 已修复: 删除了冗余的 REST 错误处理程序。

发布日期 2023年1月10日

NGC Org Web UI v0.24.3

  • 已修复: 解决了当存储数据未定义时用户遇到应用程序错误的问题。

NGC CLI 3.12.0

  • 增强功能: 用户现在可以在列出模型和资源时指定 --column description

  • 增强功能: ngc team add-user 可以与用户 ID 或电子邮件一起使用。当指定用户 ID 时,不再需要 name 参数。当指定电子邮件时,name 参数是必需的。请仅在将新的、不存在的用户添加到团队时指定电子邮件/名称。如果具有该电子邮件的帐户已存在于团队中,CLI 将要求用户使用 update-user 命令。请仅通过指定该用户的数字用户 ID 将现有用户添加到团队。

  • 增强功能: 上传模型或资源时,用户将看到动画进度条,并注意到性能的提升。

发布日期 2022年12月13日

NGC Web UI v2.104.0

  • 已修复: 用户将看到作业状态历史记录表格列标题与其相关数据之间更好的视觉对齐。

  • 增强功能: 用户可以暂停可恢复的多节点作业,从而更好地控制作业和分配的 GPU 资源。

  • 增强功能: 检索结果集和数据集文件的性能改进。作业结果集和数据集文件现在直接从文件存储服务实时获取,从而减少了这些文件在 UI 中变为可见所需的时间。此外,用户现在可以直接从工作空间详细信息页面查看和下载工作空间文件。

NGC Org Web UI v0.23.2

  • 已修复: 解决了在表格中悬停在 GPU 类型上时,工具提示中不显示类型名称的问题。

  • 已修复: 修复了组织 > 使用情况下的每日峰值图的对齐问题。

  • 已修复: 解决了为组织 > 使用情况月度峰值表选择时间范围导致应用程序错误的问题。

  • 已修复: 解决了组织 > 使用情况月度峰值表缺少排序功能的问题。

  • 已修复: 解决了 GPU 使用率月度峰值总计未在新月初重置的问题。

  • 增强功能: 重新设计了组织 > 使用情况页面,以改进 GPU 月度和每日峰值使用率、系统信息以及日志和私有注册表使用情况的显示。

NGC CLI 3.11.0

  • 已修复: NGC CLI 现在支持正确编码电子邮件地址中找到的特殊字符,例如 _ .+ -。

  • 已修复: 解决了在某些情况下,用户在发出 NGC CLI 命令 ngc config set 时看到警告消息“拒绝访问检索 ace 列表”的问题。

  • 已修复: 解决了取消注册表资源下载导致向用户显示错误消息的问题。

  • 已修复: 解决了下载来宾注册表资源的单个文件的问题。

  • 增强功能: 用户可以暂停可恢复的多节点作业,从而更好地控制作业和分配的 GPU 资源。

通知

通知

本文档仅供参考,不应被视为对产品的特定功能、条件或质量的保证。NVIDIA Corporation(“NVIDIA”)对本文档中包含的信息的准确性或完整性不作任何明示或暗示的陈述或保证,并且对本文档中包含的任何错误不承担任何责任。NVIDIA 对使用此类信息或因使用此类信息而可能导致的侵犯第三方专利或其他权利的后果不承担任何责任。本文档并非承诺开发、发布或交付任何材料(如下定义)、代码或功能。

NVIDIA 保留随时对此文档进行更正、修改、增强、改进和任何其他更改的权利,恕不另行通知。

客户应在下订单前获取最新的相关信息,并应验证此类信息是否为最新且完整。

NVIDIA 产品根据订单确认时提供的 NVIDIA 标准销售条款和条件进行销售,除非 NVIDIA 和客户的授权代表签署的个别销售协议(“销售条款”)另有约定。NVIDIA 在此明确反对将任何客户通用条款和条件应用于购买本文档中引用的 NVIDIA 产品。本文档未直接或间接地形成任何合同义务。

NVIDIA 产品并非设计、授权或保证适用于医疗、军事、航空、航天或生命支持设备,也不适用于 NVIDIA 产品的故障或故障可以合理预期会导致人身伤害、死亡或财产或环境损害的应用。NVIDIA 对在此类设备或应用中包含和/或使用 NVIDIA 产品不承担任何责任,因此此类包含和/或使用由客户自行承担风险。

NVIDIA 不声明或保证基于本文档的产品将适用于任何特定用途。NVIDIA 不一定对每种产品的所有参数进行测试。客户全权负责评估和确定本文档中包含的任何信息的适用性,确保产品适合并适用于客户计划的应用,并为该应用执行必要的测试,以避免应用或产品的默认设置。客户产品设计中的缺陷可能会影响 NVIDIA 产品的质量和可靠性,并可能导致超出本文档中包含的附加或不同条件和/或要求。对于可能基于或归因于以下原因的任何默认设置、损坏、成本或问题,NVIDIA 不承担任何责任:(i) 以任何违反本文档的方式使用 NVIDIA 产品或 (ii) 客户产品设计。

本文档未授予 NVIDIA 专利权、版权或其他 NVIDIA 知识产权下的任何明示或暗示的许可。NVIDIA 发布的有关第三方产品或服务的信息不构成 NVIDIA 授予使用此类产品或服务的许可,也不构成对其的保证或认可。使用此类信息可能需要从第三方获得第三方专利或其他知识产权下的许可,或者从 NVIDIA 获得 NVIDIA 专利或其他知识产权下的许可。

只有在事先获得 NVIDIA 书面批准的情况下,才允许复制本文档中的信息,并且复制必须不得更改,完全符合所有适用的出口法律和法规,并附带所有相关的条件、限制和声明。

本文档和所有 NVIDIA 设计规范、参考板、文件、图纸、诊断程序、列表和其他文档(统称为“材料”)均“按原样”提供。NVIDIA 对材料不作任何明示、暗示、法定或其他方面的保证,并明确否认所有关于不侵权、适销性和适用于特定用途的暗示保证。在法律未禁止的范围内,在任何情况下,NVIDIA 均不对因使用本文档而引起的任何损害负责,包括但不限于任何直接、间接、特殊、附带、惩罚性或后果性损害,无论其成因和责任理论如何,即使 NVIDIA 已被告知可能发生此类损害。尽管客户可能因任何原因而遭受任何损害,但 NVIDIA 对本文所述产品的客户的累计总责任应根据产品的销售条款进行限制。

商标

NVIDIA、NVIDIA 徽标和 Base Command 是 NVIDIA Corporation 在美国和其他国家/地区的商标和/或注册商标。其他公司和产品名称可能是与其相关的各自公司的商标。