重要提示

您正在查看 NeMo 2.0 文档。此版本引入了对 API 和新库 NeMo Run 的重大更改。我们目前正在将 NeMo 1.0 的所有功能移植到 2.0。有关先前版本或 2.0 中尚不可用的功能的文档,请参阅 NeMo 24.07 文档

扩散模型#

NeMo 2.0 支持训练扩散模型,包括文本到图像和文本到视频模型。NeMo 2.0 使用 NeMo-Run 来促进跨多个 GPU 的扩展。NeMo 2.0 目前支持以下扩散模型

为每个模型提供了默认配置,并在上面链接的模型特定文档中概述。每个配置都可以修改,以在新数据集上进行训练或测试新的模型超参数。