故障排除#

NVCF 托管限制#

  • 在 30 秒不活动后,grpc 通道将关闭。

  • 创建 grpc 通道时,您可能需要重新上传音频文件

目前,RAM 用于在每个实例中存储音频。A2F-3D 创作微服务的多个实例托管在 NVCF 上。这意味着当建立新连接时,您可能没有连接到您上传音频文件的实例。因此,您将需要再次上传音频文件。如果找不到音频文件,微服务将抛出错误。

启动失败#

如果您之前使用 Docker 版本的 A2F-3D 创作微服务,则卷可能被缓存并包含旧模型和 SDK 版本。错误消息可能类似于:

$ [A2E SDK] [ERROR] Cannot Initialize from Json file: /opt/nvidia/a2f_pipeline/a2e_data/nets/a2e_v1.4.2/a2e_ms_config.json

按照 Docker 文档删除旧的缓存卷。如果您使用了我们的 容器部署 指南,请运行以下命令删除卷和容器

$ docker compose down -v
$ docker container prune -f

已知问题#

  • 非语言的人类声音(例如“嗯……”)和非人类音频不能很好地转化为面部表情,导致嘴唇随机运动。这是未来需要改进的领域。

  • 在服务启动时,前 N 个请求(N = 选择的批处理大小,默认 N=10)将具有高延迟。例如:在 4090 上为 160 毫秒,而不是 30 毫秒。

  • 目前,音频文件大小限制为 4MB。这将通过 proto 文件更新来修复,该更新将转换音频上传 RPC 以使用流式传输。

  • 我们建议用户以 16kHz 采样率上传音频。如果不是,服务将执行重采样;但是,音频不得太短,以确保成功重采样。

  • 当调用 generate_code_from_protos.py 时,会出现警告。这些警告是无害的。