切换导航侧边栏

切换页内目录

NVIDIA Riva

入门指南

概述
快速入门指南
NVIDIA AI Enterprise 试用
发行说明

安装

最佳实践
本地 (Docker)
Kubernetes
如何在 AWS 上使用 EKS 大规模部署 Riva
NVIDIA Fleet Command

教程

语音识别
语音识别 - 新语言适配
云部署
语音合成
翻译

架构

概述
新编程语言的客户端

语音识别

ASR 概述
语音识别基础知识和 Riva ASR 的自定义
管道配置
性能
ASR 高级细节

语音合成

TTS 概述
TTS 推理和自定义
TTS 零样本
自定义语音的说话人适配器
自定义模型
性能
TTS 部署
音素支持
数据收集 - 脚本生成

自然语言处理

NLP 概述
自定义模型

翻译

翻译概述
自定义模型
性能

SDK 和示例应用

Python
命令行客户端
示例应用

参考

模型
gRPC & Protocol Buffers
故障排除
支持矩阵
升级
致谢
终端用户许可协议
注意事项

模型

模型#

语音识别
- Parakeet
- Conformer-CTC
- Citrinet
- Jasper
- QuartzNet
- MarbleNet
- TitaNet
自然语言处理
- BERT
- DistilBERT
- Megatron
自然机器翻译 (NMT)
- 基于 Transformer 的 Seq2Seq
语音合成
- Mel 频谱图生成器
- 声码器

上一页

AudioCodes VoiceGateway 示例

下一页

语音识别

由 NVIDIA 提供
© 版权所有 2024 NVIDIA CORPORATION 及关联公司。保留所有权利。
最后更新于 2025 年 1 月 3 日。

© . All rights reserved.