发行说明#

版本 1.3.0#

主要特性和增强功能#

  • 新的 ASR 模型

    • Canary 1b 多语言

    • Canary 0.6b Turbo 多语言

    • Whisper Large v3

    • Conformer 西班牙语 (es-US)

  • 简化部署,基于硬件自动选择配置文件。

  • 支持在 WSL2 环境中部署

已知问题#

  • Canary 模型对于某些语言(如 es-ES 和 ko-KR)可能会产生不正确的翻译输出

  • 仅在计算能力 <= 9.0 的 GPU 上支持使用 RMIR 模型格式进行部署。

  • WSL 不支持 NMT NIM。

  • Whisper 的 ASR HTTP API 仅接受请求中的 filemodellanguage 参数。其他参数将被忽略。

  • Whisper 的 ASR gRPC API 仅支持离线 Recognize API。

  • Whisper 的 ASR gRPC API 在 RecognitionConfig 消息中不支持自定义参数(例如,profanity_filterenable_word_time_offsetsenable_automatic_punctuationverbatim_transcripts)。

  • 此版本不支持说话人分离功能。

版本 1.2.0#

主要特性和增强功能#

  • 新的 ASR 模型

    • Conformer-CTC 西班牙语 (es-US)

    • Whisper Large v3,支持多语言转录和翻译成英语

已知问题#

  • Whisper 的 ASR HTTP API 仅接受请求中的 filemodellanguage 参数。其他参数将被忽略。

  • Whisper 的 ASR gRPC API 仅支持离线 Recognize API。

  • Whisper 的 ASR gRPC API 在 RecognitionConfig 消息中不支持自定义参数(例如,profanity_filterenable_word_time_offsetsenable_automatic_punctuationverbatim_transcripts)。

版本 1.1.0#

  • 添加了对使用单个容器服务所有模型的支持。

  • 添加了在支持的 GPU 上部署 TensorRT 优化模型的支持。

版本 1.0.0#

这是 NVIDIA NIM for Riva 的首个正式版本,支持以下模型

  • ASR 模型

    • Parakeet 1.1b CTC 英语 (en-US)

  • TTS 模型

    • Fastpitch HifiGAN 英语 (en-US)

  • NMT 模型

    • Megatron 1b 任意到任意文本到文本翻译(32 种语言)