重要提示
您正在查看 NeMo 2.0 文档。此版本引入了对 API 的重大更改和一个新的库 NeMo Run。我们目前正在将所有功能从 NeMo 1.0 移植到 2.0。有关先前版本或 2.0 中尚未提供的功能的文档,请参阅 NeMo 24.07 文档。
语法定制#
警告
TN/ITN 已从 NVIDIA/NeMo 存储库过渡到独立的 NVIDIA/NeMo-text-processing 存储库。所有更新和讨论/问题都应转到新存储库。
所有语法开发均使用 Pynini 库完成。这些语法可以导出到 .far 文件,并与 Riva/Sparrowhawk 一起使用,有关详细信息,请参阅 文本处理部署。
定制语法的步骤#
从源代码安装 NeMo-TN
运行 nemo_text_processing/text_normalization/normalize.py 或 nemo_text_processing/inverse_text_normalization/inverse_normalize.py 并带有 –verbose 标志,以评估目标案例的当前行为,请参阅脚本和 本教程中的参数详细信息
修改现有语法或添加新语法以覆盖目标案例,使用 关于如何编写新语法的教程
- 在此处添加新的测试用例 here
运行 python 测试
(optionally build grammars first and save to CACHE_DIR) cd tests/nemo_text_processing && cd pytest <LANGUAGE>/test_*.py --cpu --tn_cache_dir=CACHE_DIR_WITH_FAR_FILES (--run_audio_based flag to also run audio-based TN tests, optional)
运行 Sparrowhawk 测试
cd tools/text_processing_deployment && bash export_grammars.sh --GRAMMARS=<TN/ITN grammars> --LANGUAGE=<LANGUAGE> --MODE=test
WFST TN/ITN 资源可以在 此处找到。