NVIDIA 文档中心 NVIDIA TAO TAO v5.5.0 概述

概述

Train, Adapt, Optimize (TAO) API 是一种云服务，可以使用自定义数据集构建端到端 AI 模型。除了通过 API 公开 TAO 功能外，该服务还使客户端能够构建端到端工作流程 - 创建数据集、模型、从 NGC 获取预训练模型、获取默认规范、训练、评估、优化和导出模型以在边缘部署。TAO 作业在多节点云集群中的 GPU 上运行。

您可以在提供的 API 之上开发客户端应用程序，或使用提供的 TAO 远程客户端 CLI。

API 允许您创建数据集并将数据上传到服务，或直接从公共云链接将数据拉取到服务，而无需上传。然后，您可以创建模型，并通过将模型链接到训练、评估和推理数据集来创建实验。

可以使用 API 调用生成诸如训练、评估、剪枝、再训练、导出和推理之类的操作。对于每个操作，您可以请求操作的默认参数，根据自己的喜好更新这些参数，然后在运行操作时传递它们。规范采用 JSON 格式。

该服务公开了一个 Job API 端点，允许您取消、下载和监控作业。Job API 端点还提供有用的信息，例如 epoch 编号、准确率、损失值和 ETA。

此外，该服务在集群内划分不同的用户，并可以保护读写访问。

TAO 远程客户端是一个命令行界面 (CLI)，它使用 API 调用来公开类似于 TAO Launcher CLI 的界面。

REST API 的用例是第三方 Web-UI 云服务，而远程客户端的用例包括训练场、内部模型生产系统和研究项目。

上一步在 AKS 上运行 TAO

下一步设置