性能#

NVIDIA 大幅优化了 DiffDock 推理工作流程,通过优化的 CUDA 内核来加速 3D 等变图神经网络和模型中的其他关键操作,从而提升其性能。

性能基准#

图 1 和表 1 展示了在不同 GPU 型号上运行 NVIDIA 优化的 DiffDock NIM 与基准软件的性能基准。此处使用的基准软件是 GitHub v1.0 版本。性能指标是通过运行 92 个对接推理任务的时间成本来衡量的,每个任务设置为生成 10 个姿势,其他运行时参数设置为默认值。有关硬件平台和基准数据集的更多详细信息,请参见接下来的两节。

Benchmarks

图 1#

表 1#

GPU

基准

NV 优化

加速

RTX A6000 48GB

0.374

2.852

7.6倍

A100 80GB PCIe

0.740

4.023

5.4倍

L40S 48GB

0.691

4.485

6.5倍

H100 80GB PCIe

0.932

5.226

5.6倍

H100 80GB SXM5 HBM3

1.097

6.835

6.2倍

基准硬件#

生成基准测试的完整硬件规格和操作系统如下所示

GPU

CPU

CPU 内存

RTX A6000 48GB

Intel(R) Xeon(R) Silver 4208 8-Core CPU @ 2.10GHz

Samsung DDR4 2666MHz 16GB x 4

A100 80GB PCIe

AMD EPYC 7232P 8-Core Processor @ 3.10GHz

Samsung DDR4 3200MHz 32GB x 4

L40S 48GB

AMD EPYC 7313P 16-Core Processor @ 3.00GHz

Micron DDR4 3200MHz 32GB x 4

H100 80GB PCIe

AMD EPYC 7232P 8-Core Processor @ 3.10GHz

Samsung DDR4 3200MHz 32GB x 4

H100 80GB SXM5 HBM3

Intel(R) Xeon(R) Silver 4314 16-Core CPU @ 2.40GHz

Samsung DDR4 3200MHz 32GB x 8

注意

所有系统均安装了 Ubuntu 22.04 LTS 操作系统。

基准数据#

选择了 92 个蛋白质-配体复合物系统作为 PoseBusters 数据集的子组,这是一项研究工作,在此处发布。完整数据集可以从 Zenodo 下载。

以下是这 92 个系统的复合物 ID

7ORW_7WA 8DW5_FQ7 7QF4_RBF 8EAD_UY0 7JGW_V9S 7JMV_4NC 7W6F_8I6 7T2I_E9F 7L81_UD4 
7RWS_4UR 7MMH_ZJY 8CGC_LMR 5SAK_ZRY 7MGT_ZD4 7ELT_TYM 7NR8_UOE 7U0U_FK5 7RZL_NPO 
8C5M_MTA 7JR8_VH7 7LMO_NYO 7PT3_3KK 8E77_ULP 7THI_PGA 7NFB_GEN 7KP6_WTP 7NF3_4LU 
7UMW_NAD 7F8T_FAD 7C8Q_DSG 6ZK5_IMH 7M6K_YRJ 8SLG_G5A 8FV9_80J 7L00_XCJ 7MSR_DCA 
6TW5_9M2 6XHT_V2V 7BMI_U4B 7C0U_FGO 7DUA_HJ0 7E2S_BLA 7FB7_8NF 7FRX_O88 7KFO_IAC 
7KLX_WOV 7KQU_YOF 7KZ9_XN7 7LJN_GTP 7M31_TDR 7M3H_YPV 7MAE_XUS 7MFP_Z7P 7NF0_BYN 
7NXO_UU8 7OP9_06K 7OU8_1XI 7POM_7VZ 7QHL_D5P 7QSW_CAP 7R3D_APR 7R6J_2I7 7R9N_F97 
7SDD_4IP 7SUC_COM 7T0U_E3I 7T1D_E7K 7T3F_EM0 7T9O_GEI 7TB0_UD1 7TOM_5AD 7TS6_KMI 
7TSF_H4B 7U3J_L6U 7UAS_MBU 7UJ4_OQ4 7UJ5_DGL 7UY4_SMI 7VKZ_NOJ 7WJB_BGC 7WUX_6OI 
7XRL_FWK 7ZCC_OGA 7ZDY_6MJ 7ZXV_45D 7ZXZ_K9R 8AQL_PLG 8B8H_OJQ 8CI0_8EL 8D5D_5DK 
8FLV_ZB9 8G0V_YHT