支持矩阵#
模型#
模型名称 |
模型 ID |
发布者 |
---|---|---|
mark |
mark_v2.3 |
NVIDIA |
claire |
claire_v2.3 |
NVIDIA |
james |
james_v2.3 |
NVIDIA |
优化配置#
GPU |
GPU 内存 (GB) |
精度 |
---|---|---|
A10G |
24 |
FP16 |
L40S |
48 |
FP16 |
A100 |
15 |
FP16 |
H100 |
80 |
FP16 |
RTX6000 |
48 |
FP16 |
RTX4090 |
24 |
FP16 |
Audio2Face-3D 不支持多 GPU。 如果你想使用更多 GPU,你将不得不为每个 GPU 启动 Audio2Face-3D 的多个实例,并管理如何将请求路由到每个实例。
非优化配置#
GPU 内存使用量取决于启动 Audio2Face-3D 时配置的并发连接数 (number_of_streams)。
注意
此近似值是在 RTX 4090 和 RTX 3080 Ti 上观察到的,未生成 TRT 引擎。
GPU |
GPU 内存 (GB) |
精度 |
---|---|---|
任何具有足够 GPU 内存和计算能力的 NVIDIA GPU |
0.15 * number_of_streams + 9 |
FP16 |
软件#
操作系统 |
Ubuntu 22.04(裸机或使用 WSL) |
NVIDIA CUDA |
12.6 |
NVIDIA 驱动程序 |
535.183.06(用于数据中心 GPU),560.35.03(用于 RTX GPU)和 560.94(用于 Windows WSL) |
NVIDIA Container Toolkit |
最新版本 |
Docker |
最新版本 |
任何 Linux 发行版都应该可以工作,但未经我们的团队测试
你的 Docker 环境必须支持 NVIDIA GPU。 请参阅 NVIDIA Container Toolkit 以获取更多信息。