性能#

NV-CLIP NIM 的性能是通过测量 API 调用的端到端延迟来计算的。它是 100 次迭代的平均值。

延迟值以秒为单位;吞吐量值以每秒输入为单位。

GPU

精度

输入类型

分辨率

批大小

延迟

吞吐量

H100 SXM

FP16

图像

350x197

64

0.2568

249.22

H100 PCIe

FP16

图像

350x197

64

0.2568

249.22

A100 SXM

FP16

图像

350x197

64

0.3968

160.57

A100 PCIe

FP16

图像

350x197

64

0.3968

160.57

L40S

FP16

图像

350x197

64

0.3562

179.67

A10G

FP16

图像

350x197

64

0.615

104.07

A6000 Ada

FP16

图像

350x197

64

0.3701

172.93

RTX 4090

FP16

图像

350x197

64

0.339

188.78