重要提示
您正在查看 NeMo 2.0 文档。此版本对 API 和新库 NeMo Run 进行了重大更改。我们目前正在将所有功能从 NeMo 1.0 移植到 2.0。有关先前版本或 2.0 中尚不可用的功能的文档,请参阅 NeMo 24.07 文档。
数据集#
输入数据应以换行符分隔的 JSON 格式提供,如下所示
{"audio_filepath": "/path/to/abcd.wav", "offset": 0, "duration": 10.1, "text": "{'scenario': 'Calendar', 'action': 'Create_entry', 'entities': [{'type': 'event_name', 'filler': 'brunch'}, {'type': 'date', 'filler': 'Saturday'}, {'type': 'timeofday', 'filler': 'morning'}, {'type': 'person', 'filler': 'Aronson'}]}"}
语义注释是一个展平为字符串的 Python 字典,并由清单中的“text”键索引。对于语义注释,有三个强制性键:“scenario”、“action”和“entities”。“scenario”和“action”的值是字符串,“entities”的值是 Python 字典列表。“entities”中的每个项目也是一个 Python 字典,带有两个键“type”(实体槽位)和“filler”(槽位填充)。