共享 Audio2Face-3D 计算资源#

在某些用例中,Audio2Face-3D 微服务将与其他利用 GPU 计算的服务并行运行。对于这些服务执行间歇性计算任务的大多数场景,这种设置通常是足够的。

然而,对于涉及持续和高强度计算需求的场景,例如渲染器,需要进行某些调整以优化 Audio2Face-3D 计算利用率。

注意

为了获得最佳性能,我们建议在单独的系统上运行 Audio2Face-3D 和渲染器,以避免资源争用。

与渲染器共享 Audio2Face-3D 计算资源#

本节概述了在 Audio2Face-3D 微服务和渲染器之间共享 GPU 的最佳实践。

Audio2Face-3D 旨在快速服务众多客户端,从而在处理音频剪辑时导致高计算使用率。

以下指南将帮助您通过减慢处理速度来稳定 Audio2Face-3D 的 GPU 使用率,同时确保至少实时速度,从而为您的渲染应用程序带来更流畅的运行。

注意

在 Audio2Face-3D 和渲染应用程序之间共享 GPU 的可行性取决于 GPU 的性能和渲染应用程序的计算需求。

稳定 Audio2Face-3D GPU 使用率

我们建议从单流部署 (stream_number=1) 开始,并按如下方式发送音频数据

  • 首先,发送一个持续 500 毫秒的音频块。

  • 然后,每秒发送 30 次 35 毫秒的音频 (35 毫秒 * 30 = 1.050 秒 = 31.5 FPS)。

此方法允许 Audio2Face-3D 微服务以大约 31 FPS 的速度处理数据。以略高于 30 FPS 的速度流式传输可减少卡顿的机会,并有助于平滑 GPU 处理使用率。

此外,在构建 TRT 引擎时,使用 fp16 选项将实现更高效的计算。

优化渲染性能

以下渲染设置可以在 Nvidia 控制面板中配置

../../../_images/panel_part1.png ../../../_images/panel_part2.png ../../../_images/panel_part3.png ../../../_images/panel_part4.png