TAO v5.5.0

概述

Train, Adapt, Optimize (TAO) API 是一种云服务,可以使用自定义数据集构建端到端 AI 模型。除了通过 API 公开 TAO 功能外,该服务还使客户端能够构建端到端工作流程 - 创建数据集、模型、从 NGC 获取预训练模型、获取默认规范、训练、评估、优化和导出模型以在边缘部署。TAO 作业在多节点云集群中的 GPU 上运行。

您可以在提供的 API 之上开发客户端应用程序,或使用提供的 TAO 远程客户端 CLI。

tao_toolkit_api.png

API 允许您创建数据集并将数据上传到服务,或直接从公共云链接将数据拉取到服务,而无需上传。然后,您可以创建模型,并通过将模型链接到训练、评估和推理数据集来创建实验。

可以使用 API 调用生成诸如训练、评估、剪枝、再训练、导出和推理之类的操作。对于每个操作,您可以请求操作的默认参数,根据自己的喜好更新这些参数,然后在运行操作时传递它们。规范采用 JSON 格式。

该服务公开了一个 Job API 端点,允许您取消、下载和监控作业。Job API 端点还提供有用的信息,例如 epoch 编号、准确率、损失值和 ETA。

此外,该服务在集群内划分不同的用户,并可以保护读写访问。

tao_workflow.png

TAO 远程客户端是一个命令行界面 (CLI),它使用 API 调用来公开类似于 TAO Launcher CLI 的界面。

REST API 的用例是第三方 Web-UI 云服务,而远程客户端的用例包括训练场、内部模型生产系统和研究项目。

上一步 在 AKS 上运行 TAO
下一步 设置
© 版权所有 2024, NVIDIA。 上次更新于 2024 年 10 月 15 日。