重要提示
您正在查看 NeMo 2.0 文档。此版本对 API 和新库 NeMo Run 进行了重大更改。我们目前正在将 NeMo 1.0 中的所有功能移植到 2.0。有关先前版本或 2.0 中尚未提供的功能的文档,请参阅 NeMo 24.07 文档。
资源和文档指南#
实践操作的说话人识别教程 notebook 可以在 speaker_tasks 教程文件夹下找到。此教程和大多数其他教程可以通过在 Colab 上指定 notebook 的 GitHub 页面链接来在 Google Colab 上运行。
如果您正在查找有关特定 SpeakerNet 模型的信息,或者想了解有关 nemo_asr
集合中可用的模型架构的更多信息,请查看模型页面。
有关数据集预处理的文档可以在数据集页面上找到。NeMo 在 <nemo/scripts/speaker_tasks/> 文件夹中包含 speaker_recognition 的预处理和其他脚本,此页面包含有关运行这些脚本的说明。如果您有自己的数据,它还包括创建您自己的 NeMo 兼容数据集的指南。
有关如何加载模型检查点(本地文件或来自 NGC 的预训练检查点)、执行推理以及 NGC 上可用检查点列表的信息,请访问检查点页面。
有关特定于 nemo_asr
模型的配置文件的文档,可以在配置文件页面上找到。
对于清晰的逐步教程,我们建议您参考 folder 中的教程。