重要

您正在查看 NeMo 2.0 文档。此版本引入了 API 的重大更改和一个新的库 NeMo Run。我们目前正在将 NeMo 1.0 的所有功能移植到 2.0。有关先前版本或 2.0 中尚不可用的功能的文档,请参阅 NeMo 24.07 文档

资源和文档指南#

端到端和级联系统的动手说话人日志教程笔记本可以在 <NeMo_root>/tutorials/speaker_tasks 下找到。

还有关于执行端到端说话人日志和级联说话人日志的教程。我们还提供了关于使用 NeMo ASR 集合获取 ASR 转录以及说话人标签和语音活动时间戳的教程。

大多数教程可以在 Google Colab 上运行,方法是在 Colab 上指定指向笔记本 GitHub 页面的链接。

如果您正在查找有关用于说话人日志推理的特定模型的信息,或者想了解更多关于 nemo_asr 集合中可用的模型架构的信息,请查看模型页面。

有关数据集预处理的文档可以在数据集页面上找到。NeMo 包括几个常见 ASR 数据集的预处理脚本,此页面包含有关运行这些脚本的说明。如果您有自己的数据,它还包括创建您自己的 NeMo 兼容数据集的指南。

有关如何加载模型检查点(本地文件或来自 NGC 的预训练模型)、执行推理以及 NGC 上可用的检查点列表的信息,请参见检查点页面。

有关特定于 nemo_asr 模型的配置文件的文档,请参见配置文件页面。