关于合作伙伴验证配置#

合作伙伴验证配置旨在帮助希望将 NVIDIA GPU 与 NVIDIA 不支持的基于 Kubernetes 的软件堆栈结合使用的最终用户。

基于 Kubernetes 的软件堆栈的供应商可以自行验证采用其软件的 NVIDIA GPU Operator,以便满足其最终用户的需求。

当合作伙伴自行验证其软件与 GPU Operator 的兼容性时,合作伙伴会编写最终用户所需的文档。然后,合作伙伴和 NVIDIA 会将信息添加到本文档中。最终用户可以阅读有关已验证的软件版本、如何将 GPU Operator 与软件堆栈结合使用以及如何报告问题的详细信息。

重要提示

合作伙伴验证配置依赖于社区支持,不构成 NVIDIA AI Enterprise 的企业级支持。虽然合作伙伴验证的堆栈是必要的第一步,但这并不保证将来会自动升级到 NVIDIA AI Enterprise 的企业级支持。

合作伙伴如何贡献验证配置#

您可以通过发送电子邮件联系 NVIDIA 团队。NVIDIA 将主动联系您,安排会议讨论软件堆栈和任何问题。

合作伙伴必须做什么#

您需要提供以下内容

  • 说明您是否为 CNCF 成员,以及您的软件堆栈是否为 CNCF 认证 Kubernetes 软件一致性计划 的一部分。

  • 记录并贡献您自行验证的确切软件堆栈。请参阅文档存储库 partner-validated 目录中的 PARTNER-VALIDATED-TEMPLATE.rst 文件,作为起点。打开一个拉取请求到存储库,更新您的内容。请参阅文档存储库根目录中的 CONTRIBUTING.md 文件,了解有关贡献文档的信息。

  • 运行自行验证的配置,然后通过提供 must-gather 的输出来与 NVIDIA 分享结果。

  • 根据要求,提供 NVIDIA 远程访问权限,以便 NVIDIA 团队可以执行进一步的验证。

  • 指定一个 GitHub 用户名,以便最终用户在打开特定于合作伙伴自行验证的堆栈的 GitHub 问题时,NVIDIA 可以参考该用户名。

执行上述步骤并不能保证 NVIDIA 会将您的自行验证配置纳入 GPU Operator 文档中。

最终用户如何获得支持#

最终用户从合作伙伴处获得支持,而不是从 NVIDIA 处获得支持。

如果最终用户在使用合作伙伴验证配置和 NVIDIA GPU Operator 时遇到问题,最终用户应与其合作伙伴支持联系人联系。

合作伙伴在其贡献的文档中包含“获取支持”标题,其中包含联系信息。

合作伙伴如何从 NVIDIA 获得支持#

当合作伙伴在没有 NVIDIA 帮助的情况下无法解决最终用户问题时,合作伙伴有责任在 NVIDIA 支持的软件堆栈之一上重现该问题。

NVIDIA 在 NVIDIA GPU Operator 产品文档中记录了 支持的操作系统和 Kubernetes 平台

在合作伙伴记录在 NVIDIA 支持的软件堆栈上重现问题的步骤后,合作伙伴可以在 NVIDIA GPU Operator GitHub 存储库中报告有关受支持软件堆栈的问题。

NVIDIA 将尽最大努力调查并修复受支持软件堆栈上的问题。在 NVIDIA 为 NVIDIA 支持的软件堆栈开发并发布修复程序后,合作伙伴将进行验证,并在必要时将修复程序移植到合作伙伴软件堆栈。

在合作伙伴提供软件(例如 GPU 驱动程序镜像)的情况下,合作伙伴负责软件的维护和支持。此维护和支持包括安全和错误修复。

常见问题解答#

NVIDIA 是否会将合作伙伴的软件堆栈添加到 NVIDIA GPU Operator QA 流程中?

不会,但我们建议客户将 GPU Operator 纳入合作伙伴的 QA 流程中。

合作伙伴是否必须针对所有版本的合作伙伴软件堆栈进行认证?

是的,如果合作伙伴希望文档包含版本列表。否,如果合作伙伴只想验证合作伙伴软件的特定版本。

是否会有与这些合作伙伴验证配置相关的任何法律协议/谅解备忘录?

不会。合作伙伴提供支持,社区也可能提供支持,因此主要目标是建立互惠互利的合作伙伴协作关系。

如果合作伙伴想要删除他们贡献的文档会怎么样?

合作伙伴将从此文档中删除,不再作为未来版本的受支持配置。对于以前支持的配置,由合作伙伴负责与最终客户沟通平稳退出策略。

如果合作伙伴需要对 NVIDIA GPU Operator 进行特定于合作伙伴软件堆栈的更改,会怎么样?

GPU Operator 是开源的,并欢迎审核收到的拉取请求。

如何管理 NVIDIA GPU Operator 使用的合作伙伴软件的 CVE 修复?

合作伙伴负责管理安全问题,并建议主动通知用户问题和修复程序。当合作伙伴向用户提供软件(例如容器化的 GPU 驱动程序)时,合作伙伴负责通知和解决容器镜像的问题。