重要提示

您正在查看 NeMo 2.0 文档。此版本引入了对 API 的重大更改和一个新的库 NeMo Run。我们目前正在将所有功能从 NeMo 1.0 移植到 2.0。有关先前版本或 2.0 中尚未提供的功能的文档,请参阅 NeMo 24.07 文档

语法定制#

警告

TN/ITN 已从 NVIDIA/NeMo 存储库过渡到独立的 NVIDIA/NeMo-text-processing 存储库。所有更新和讨论/问题都应转到新存储库。

所有语法开发均使用 Pynini 库完成。这些语法可以导出到 .far 文件,并与 Riva/Sparrowhawk 一起使用,有关详细信息,请参阅 文本处理部署

定制语法的步骤#

  1. 从源代码安装 NeMo-TN

  2. 运行 nemo_text_processing/text_normalization/normalize.pynemo_text_processing/inverse_text_normalization/inverse_normalize.py 并带有 –verbose 标志,以评估目标案例的当前行为,请参阅脚本和 本教程中的参数详细信息

  3. 修改现有语法或添加新语法以覆盖目标案例,使用 关于如何编写新语法的教程

  4. 在此处添加新的测试用例 here
    • 运行 python 测试

    (optionally build grammars first and save to CACHE_DIR)
    cd tests/nemo_text_processing &&
    cd pytest <LANGUAGE>/test_*.py --cpu --tn_cache_dir=CACHE_DIR_WITH_FAR_FILES (--run_audio_based flag to also run audio-based TN tests, optional)
    
    • 运行 Sparrowhawk 测试

    cd tools/text_processing_deployment &&
    bash export_grammars.sh --GRAMMARS=<TN/ITN grammars> --LANGUAGE=<LANGUAGE> --MODE=test
    

WFST TN/ITN 资源可以在 此处找到。

Riva 资源#