重要提示

您正在查看 NeMo 2.0 文档。此版本引入了对 API 的重大更改和一个新的库 NeMo Run。我们目前正在将 NeMo 1.0 的所有功能移植到 2.0。有关先前版本或 2.0 中尚不可用的功能的文档,请参阅 NeMo 24.07 文档

NVIDIA NeMo Framework 开发者文档#

NVIDIA NeMo Framework 是一个端到端、云原生框架,旨在在任何地方构建、定制和部署生成式 AI 模型。

NVIDIA NeMo Framework 支持大规模训练功能,包括

  • 混合精度训练

  • 并行性

  • 分布式优化器

  • 全分片数据并行 (FSDP)

  • Flash Attention

  • 激活重计算

  • 位置嵌入和位置插值

  • 使用 TensorRT Model Optimizer 的训练后量化 (PTQ) 和量化感知训练 (QAT)

  • 使用 TensorRT Model Optimizer 的基于知识蒸馏的训练

  • 序列打包

NVIDIA NeMo Framework 具有用于以下内容的单独集合

每个集合都包含预构建模块,其中包括在您的数据上进行训练所需的一切。每个模块都可以轻松定制、扩展和组合,以创建新的生成式 AI 模型架构。

有关快速指南和教程,请参阅下面的“入门指南”部分。

有关更多信息,请浏览下面内容部分或左侧边栏中您感兴趣领域的开发者文档。

模型检查点

API

集合

语音 AI 工具