语音识别
语音识别#
- 如何使用 Riva ASR API 和开箱即用模型?
- 为语音提示创建语法
- 如何使用词典映射自定义 Riva ASR 词汇和发音
- 如何在 Riva 上部署使用 NeMo 训练的自定义语言模型 (n-gram)
- 如何在 Riva 上部署使用 NeMo 训练的自定义声学模型 (Citrinet)
- 如何在 Riva 上部署使用 NeMo 训练的自定义声学模型 (Conformer-CTC)
- 如何部署带有 WFST 解码器的 Conformer-CTC 声学模型
- 如何使用 NVIDIA NeMo 微调 Riva ASR 声学模型
- 如何使用适配器自定义 Riva ASR 声学模型 (Conformer-CTC)
- 带有适配器的 ASR
- 什么是适配器?
- 适配器训练的优势和局限性
- 为适配器训练准备声学编码器
- 为适配准备模型和数据集
- 创建和训练适配器
- 评估模型
- 将模型导出到 Riva
- 下一步是什么?
- 如何使用 NVIDIA NeMo 微调 Riva ASR 声学模型
- 如何提高特定词语的识别率
- 结论
- 如何合成一个噪声数据集,用于训练噪声鲁棒的 ASR 模型
- 如何通过在 Riva ASR 管道中微调声学模型 (Conformer-CTC) 来提高噪声语音的准确性
- 如何训练、评估和微调 n-gram 语言模型
- 如何将说话人分离与 Riva ASR 一起使用?
- 要求和设置
- 如何在运行时使用词语提升来提升特定词语?
- Riva 中基于类的 n-gram 语言模型支持 (WFST 解码器)
- WFST 解码