发布说明#
Release 1.3.0#
主要特性和增强功能#
新的 ASR 模型
Canary 1b 多语言
Canary 0.6b Turbo 多语言
Whisper Large v3
Conformer 西班牙语 (es-US)
基于硬件的自动配置文件选择,简化了部署。
支持在 WSL2 环境中部署
已知问题#
Canary 模型在某些语言(如 es-ES 和 ko-KR)中可能会产生不正确的翻译输出。
仅在计算能力 <= 9.0 的 GPU 上支持使用 RMIR 模型格式进行部署。
WSL 不支持 NMT NIM。
Whisper 的 ASR HTTP API 在请求中仅接受
file
、model
和language
参数。其他参数将被忽略。Whisper 的 ASR gRPC API 仅支持离线
Recognize
API。Whisper 的 ASR gRPC API 在
RecognitionConfig
消息中不支持自定义参数(例如profanity_filter
、enable_word_time_offsets
、enable_automatic_punctuation
、verbatim_transcripts
)。此版本不支持说话人分离功能。
Release 1.2.0#
主要特性和增强功能#
新的 ASR 模型
Conformer-CTC 西班牙语 (es-US)
Whisper Large v3,支持多语言转录和翻译成英语
已知问题#
Whisper 的 ASR HTTP API 在请求中仅接受
file
、model
和language
参数。其他参数将被忽略。Whisper 的 ASR gRPC API 仅支持离线
Recognize
API。Whisper 的 ASR gRPC API 在
RecognitionConfig
消息中不支持自定义参数(例如profanity_filter
、enable_word_time_offsets
、enable_automatic_punctuation
、verbatim_transcripts
)。
Release 1.1.0#
增加了对单个容器支持所有模型的功能。
增加了在受支持的 GPU 上部署 TensorRT 优化模型的功能。
Release 1.0.0#
这是 NVIDIA NIM for Riva 的首个正式版本,支持以下模型
ASR 模型
Parakeet 1.1b CTC 英语 (en-US)
TTS 模型
Fastpitch HifiGAN 英语 (en-US)
NMT 模型
Megatron 1b 任意到任意文本到文本翻译(32 种语言)