简介#
现代企业应用程序正变得越来越云原生,并且基于微服务架构。微服务,顾名思义,由一组通过定义明确的 API 进行通信的小型独立服务组成。在大多数情况下,AI 应用程序也很好地遵循了这种架构设计,因为通常有许多不同的组件需要在训练和推理工作流程中协同工作。
为了在生产环境中部署应用程序,该应用程序还必须满足以下标准
可靠性
安全性
性能
可扩展性
互操作性
什么是 NVIDIA AI 工作流程?#
NVIDIA AI 工作流程旨在提供参考解决方案,说明如何利用 NVIDIA 框架构建 AI 解决方案,以解决常见的用例。这些工作流程提供诸如微调和 AI 模型创建之类的指导,以构建在 NVIDIA 框架之上。创建应用程序的管道被突出显示,以及关于如何部署定制应用程序并将其与企业环境中常见的各种组件(例如用于编排和管理、存储、安全、网络等的组件)集成的观点。
通过为您的特定用例利用 AI 工作流程,您可以按照工作流程提供的示例简化 AI 解决方案的开发,从而
缩短开发时间,降低成本
提高准确性和性能
通过利用 NVIDIA AI 专业知识,增强对结果的信心
使用示例工作流程,您将确切地知道要使用哪个 AI 框架,如何将数据引入管道,以及如何处理数据输出。AI 工作流程被设计为微服务,这意味着它们可以单独部署在 Kubernetes 上,也可以与其他微服务一起部署,以创建可无缝扩展的生产就绪应用程序。工作流程云可部署软件包可以在不同的云实例中使用,并且是自动化和可互操作的。
NVIDIA AI 工作流程在 NVIDIA NGC 上为 NVIDIA AI Enterprise 软件客户提供。
NVIDIA AI 工作流程组件#
NVIDIA AI 工作流程作为软件包部署,其中包含 AI 框架以及用于自动化云原生解决方案的工具。AI 工作流程还具有打包组件,其中包括具有最佳实践的企业级实现,这些最佳实践可确保可靠性、安全性、性能、可扩展性和互操作性,同时允许您偏离路径。
典型的工作流程可能类似于下图

在每个工作流程中,在此堆栈的每一层都提供了有见地的指导和示例组件,以及关于如何将 AI 解决方案与这些组件集成的相关信息
- 硬件
需要 NVIDIA AI Enterprise 支持的 GPU 加速本地部署硬件或云实例。每个工作流程都提供了具体的要求和规范。
- 基础设施和编排
NVIDIA 云原生堆栈被用作示例 Kubernetes 发行版,工作流程可以在其中部署和编排。
- 支持软件
NVIDIA 云原生服务附加组件包用于部署一组组件,这些组件用于执行生产企业环境中通常需要的功能,例如身份验证/授权、监控、存储/数据库等。
- 应用程序
示例微服务以 Helm charts 和定制容器的形式提供,这些微服务作为工作流程的一部分部署,以演示如何使用 NVIDIA 框架定制和构建 AI 应用程序,并将此应用程序与其他微服务和企业软件组件集成。
注意
工作流程中使用的组件和说明旨在用作集成的示例,并且可能本身并不具备充分的生产就绪性。应定制工作流程并将其集成到自己的基础设施中,并将工作流程作为参考。例如,这些工作流程中的所有说明都假定为单节点基础设施,而生产部署应在高可用性 (HA) 环境中执行。
有关详细组件和软件堆栈的更多信息,请参阅每个工作流程的指南。