重要提示
您正在查看 NeMo 2.0 文档。此版本引入了 API 的重大更改和一个新的库,NeMo Run。我们目前正在将 NeMo 1.0 的所有功能移植到 2.0。有关先前版本或 2.0 中尚不可用的功能的文档,请参阅 NeMo 24.07 文档。
资源和文档指南#
实践语音分类教程笔记本可以在 <NeMo_git_repo>/tutorials/asr/
下找到。这里有用于语音命令检测和语音活动检测任务的训练以及离线和在线麦克风推理教程。这个和大多数其他教程都可以在 Google Colab 上运行,方法是在 Colab 上指定笔记本 GitHub 页面的链接。
如果您正在查找有关特定语音分类模型的信息,或者想了解有关 nemo_asr 集合中可用的模型架构的更多信息,请查看模型页面。
有关数据集预处理的文档可以在数据集页面上找到。NeMo 包括几个常见 ASR 数据集的预处理脚本,此页面包含有关运行这些脚本的说明。如果您有自己的数据,它还包括有关创建您自己的 NeMo 兼容数据集的指南。
有关如何加载模型检查点(本地文件或来自 NGC 的预训练模型)、执行推理以及 NGC 上可用的检查点列表的信息位于检查点页面上。
nemo_asr
模型特定的配置文件文档可以在配置文件页面上找到。