重要提示

您正在查看 NeMo 2.0 文档。此版本对 API 和新库 NeMo Run 进行了重大更改。我们目前正在将所有功能从 NeMo 1.0 移植到 2.0。有关先前版本或 2.0 中尚不可用的功能的文档,请参阅 NeMo 24.07 文档

视觉语言模型#

NeMo 2.0 拥有训练大型视觉语言模型 (VLM) 所需的一切。NeMo 2.0 使用 NeMo-Run,使其易于将 VLM 扩展到数千个 GPU。NeMo 2.0 目前支持以下 VLM

为每个模型提供默认配置,并在上面链接的模型特定文档中概述。可以修改每个配置以在新数据集上进行训练或测试新的模型超参数。