发布说明#

Release 1.3.0#

主要特性和增强功能#

  • 新的 ASR 模型

    • Canary 1b 多语言

    • Canary 0.6b Turbo 多语言

    • Whisper Large v3

    • Conformer 西班牙语 (es-US)

  • 基于硬件的自动配置文件选择,简化了部署。

  • 支持在 WSL2 环境中部署

已知问题#

  • Canary 模型在某些语言(如 es-ES 和 ko-KR)中可能会产生不正确的翻译输出。

  • 仅在计算能力 <= 9.0 的 GPU 上支持使用 RMIR 模型格式进行部署。

  • WSL 不支持 NMT NIM。

  • Whisper 的 ASR HTTP API 在请求中仅接受 filemodellanguage 参数。其他参数将被忽略。

  • Whisper 的 ASR gRPC API 仅支持离线 Recognize API。

  • Whisper 的 ASR gRPC API 在 RecognitionConfig 消息中不支持自定义参数(例如 profanity_filterenable_word_time_offsetsenable_automatic_punctuationverbatim_transcripts)。

  • 此版本不支持说话人分离功能。

Release 1.2.0#

主要特性和增强功能#

  • 新的 ASR 模型

    • Conformer-CTC 西班牙语 (es-US)

    • Whisper Large v3,支持多语言转录和翻译成英语

已知问题#

  • Whisper 的 ASR HTTP API 在请求中仅接受 filemodellanguage 参数。其他参数将被忽略。

  • Whisper 的 ASR gRPC API 仅支持离线 Recognize API。

  • Whisper 的 ASR gRPC API 在 RecognitionConfig 消息中不支持自定义参数(例如 profanity_filterenable_word_time_offsetsenable_automatic_punctuationverbatim_transcripts)。

Release 1.1.0#

  • 增加了对单个容器支持所有模型的功能。

  • 增加了在受支持的 GPU 上部署 TensorRT 优化模型的功能。

Release 1.0.0#

这是 NVIDIA NIM for Riva 的首个正式版本,支持以下模型

  • ASR 模型

    • Parakeet 1.1b CTC 英语 (en-US)

  • TTS 模型

    • Fastpitch HifiGAN 英语 (en-US)

  • NMT 模型

    • Megatron 1b 任意到任意文本到文本翻译(32 种语言)