自定义模型#

Riva 支持以下 NLP 任务

  • 标点和 capitalization

使用 NVIDIA NeMo 训练的自定义、受支持的 NLP 模型可以使用 riva-buildriva-deploy 命令在 Riva 中部署,如Riva BuildRiva Deploy 部分中所述。在最简单的情况下,您可以按如下方式部署 NLP 管道

riva-build <task_name> \
    <rmir_filename>:<encryption_key>  \
    <riva_filename>:<encryption_key>  \

其中

  • <task_name> 是要部署的 NLP 管道的类型。支持的值为 punctuation

  • <rmir_filename> 是生成的 Riva rmir 文件

  • <riva_filename> 是要用作输入的 riva 文件的名称

  • <encryption_key> 是用于加密文件的密钥。NGC 上上传的预训练 Riva 模型的加密密钥为 tlt_encode

标点和 capitalization 任务(即,<task_name>=punctuation)支持一个可选参数,名为 --language_code,必须将其设置为目标模型训练所用语言的 BCP-47 (https://www.rfc-editor.org/rfc/bcp/bcp47.txt) 语言代码。当收到 enable_automatic_punctuation 布尔标志设置为 true 的 ASR 请求时,Riva 服务器将查找具有请求的语言代码的标点和 capitalization 模型,并使用它向 ASR 文本记录添加标点和 capitalization。

每个任务都支持一组参数,使您可以使用 CLI 配置您的设置。使用格式 riva-build <task name> -h 查看每个任务的可用 CLI 输入列表。

预训练模型#