重要提示
您正在查看 NeMo 2.0 文档。此版本对 API 和新库 NeMo Run 进行了重大更改。我们目前正在将 NeMo 1.0 的所有功能移植到 2.0。有关先前版本或 2.0 中尚不可用的功能的文档,请参阅 NeMo 24.07 文档。
检查点#
在 NeMo 中加载预训练检查点主要有两种方法
使用
restore_from()
方法加载本地检查点文件 (.nemo),或者使用
from_pretrained()
方法从 NGC 下载并设置检查点。
请参阅以下各节,了解每种方法的说明和示例。
请注意,这些说明适用于加载完全训练的检查点以进行评估或微调。要恢复未完成的训练实验,请使用实验管理器,并将 resume_if_exists
标志设置为 True。
加载本地检查点#
NeMo 将自动以 .nemo 格式保存您正在训练的模型的检查点。您也可以随时使用 model.save_to(<checkpoint_path>.nemo)
手动保存模型。
如果您有想要加载的本地 .nemo
检查点,只需使用 restore_from()
方法
import nemo.collections.asr as nemo_asr
model = nemo_asr.models.<MODEL_BASE_CLASS>.restore_from(restore_path="<path/to/checkpoint/file.nemo>")
其中模型基类是原始检查点的 ASR 模型类,或通用的 ASRModel 类。
推理#
音频文件应为 16KHz 单声道 wav 文件。
将音频转录为语义
加载模型后,您可以使用其“transcribe()”方法对语音样本执行推理
slu_model = nemo_asr.models.SLUIntentSlotBPEModel.from_pretrained(model_name="<MODEL_NAME>")
predictions = slu_model.transcribe([list of audio files], batch_size="<BATCH_SIZE>")
SLU 模型#
以下是 NeMo 中可用的所有语音意图分类和槽位填充模型的列表。
模型名称 |
模型基类 |
模型卡片 |
---|---|---|
slu_conformer_transformer_large_slurp |
SLUIntentSlotBPEModel |
https://ngc.nvidia.com/catalog/models/nvidia:nemo:slu_conformer_transformer_large_slurp |