重要提示

您正在查看 NeMo 2.0 文档。此版本对 API 和新库 NeMo Run 进行了重大更改。我们目前正在将 NeMo 1.0 的所有功能移植到 2.0。有关先前版本或 2.0 中尚不可用的功能的文档,请参阅 NeMo 24.07 文档

检查点#

在 NeMo 中加载预训练检查点主要有两种方法

  • 使用 restore_from() 方法加载本地检查点文件 (.nemo),或者

  • 使用 from_pretrained() 方法从 NGC 下载并设置检查点。

请参阅以下各节,了解每种方法的说明和示例。

请注意,这些说明适用于加载完全训练的检查点以进行评估或微调。要恢复未完成的训练实验,请使用实验管理器,并将 resume_if_exists 标志设置为 True。

加载本地检查点#

NeMo 将自动以 .nemo 格式保存您正在训练的模型的检查点。您也可以随时使用 model.save_to(<checkpoint_path>.nemo) 手动保存模型。

如果您有想要加载的本地 .nemo 检查点,只需使用 restore_from() 方法

import nemo.collections.asr as nemo_asr
model = nemo_asr.models.<MODEL_BASE_CLASS>.restore_from(restore_path="<path/to/checkpoint/file.nemo>")

其中模型基类是原始检查点的 ASR 模型类,或通用的 ASRModel 类。

推理#

音频文件应为 16KHz 单声道 wav 文件。

将音频转录为语义

加载模型后,您可以使用其“transcribe()”方法对语音样本执行推理

slu_model = nemo_asr.models.SLUIntentSlotBPEModel.from_pretrained(model_name="<MODEL_NAME>")
predictions = slu_model.transcribe([list of audio files],  batch_size="<BATCH_SIZE>")

SLU 模型#

以下是 NeMo 中可用的所有语音意图分类和槽位填充模型的列表。

模型名称

模型基类

模型卡片

slu_conformer_transformer_large_slurp

SLUIntentSlotBPEModel

https://ngc.nvidia.com/catalog/models/nvidia:nemo:slu_conformer_transformer_large_slurp