发行说明#
版本 1.3.0#
主要特性和增强功能#
新的 ASR 模型
Canary 1b 多语言
Canary 0.6b Turbo 多语言
Whisper Large v3
Conformer 西班牙语 (es-US)
简化部署,基于硬件自动选择配置文件。
支持在 WSL2 环境中部署
已知问题#
Canary 模型可能为某些语言(如 es-ES 和 ko-KR)产生不正确的翻译输出
仅在计算能力 <= 9.0 的 GPU 上支持使用 RMIR 模型格式进行部署。
WSL 不支持 NMT NIM。
Whisper 的 ASR HTTP API 仅接受请求中的
file
、model
和language
参数。其他参数将被忽略。Whisper 的 ASR gRPC API 仅支持离线
Recognize
API。Whisper 的 ASR gRPC API 不支持
RecognitionConfig
消息中的自定义参数(例如profanity_filter
、enable_word_time_offsets
、enable_automatic_punctuation
、verbatim_transcripts
)。此版本不支持 Diarizer 功能。
版本 1.2.0#
主要特性和增强功能#
新的 ASR 模型
Conformer-CTC 西班牙语 (es-US)
Whisper Large v3,支持多语言转录和翻译成英语
已知问题#
Whisper 的 ASR HTTP API 仅接受请求中的
file
、model
和language
参数。其他参数将被忽略。Whisper 的 ASR gRPC API 仅支持离线
Recognize
API。Whisper 的 ASR gRPC API 不支持
RecognitionConfig
消息中的自定义参数(例如profanity_filter
、enable_word_time_offsets
、enable_automatic_punctuation
、verbatim_transcripts
)。
版本 1.1.0#
添加了对单个容器支持所有模型的功能。
添加了在受支持的 GPU 上部署 TensorRT 优化模型的功能。
版本 1.0.0#
这是 NVIDIA NIM for Riva 的首个正式版本,具有对以下模型的支持
ASR 模型
Parakeet 1.1b CTC 英语 (en-US)
TTS 模型
Fastpitch HifiGAN 英语 (en-US)
NMT 模型
Megatron 1b 任意到任意文本到文本翻译(32 种语言)