性能 — NVIDIA Riva - NVIDIA 文档

评估流程#

本节展示了 Riva NMT 服务在不同 GPU 上的延迟和吞吐量数据。

这些数据是在从我们的快速入门脚本部署预配置的 NMT 管道后捕获的。

用于测量性能的命令是

riva_nmt_t2t_client
  --riva_uri=0.0.0.0:50051
  --model_name=<model name>
  --batch_size=<batch size>
  --target_language_code=<target language code>
  --source_language_code=<source language code>
  --text_file=<wmt_filename>

riva_nmt_t2t_client 返回以下延迟测量值

latency：所有返回响应的总体延迟。这是下表中所列的内容。

结果#

延迟和吞吐量测量值在下表中报告。吞吐量以每秒翻译的句子数来衡量。

有关收集这些测量值的硬件规格，请参阅硬件规格部分。

批大小	翻译/秒	p90	p95	p99
1	1.92653	0.954677	1.28243	2.06551
2	2.01023	1.93301	2.56391	3.94762
4	1.89053	4.20276	4.92518	8.14669
8	1.62168	9.02602	11.5092	22.478

批大小	翻译/秒	p90	p95	p99
1	3.85817	0.465399	0.585479	0.853542
2	4.76001	0.761249	0.966298	1.42776
4	5.19536	1.42891	1.64342	2.96342
8	4.98388	2.77319	3.436	6.99004

批大小	翻译/秒	p90	p95	p99
1	2.18725	0.845082	1.11847	1.80949
2	2.31183	1.68055	2.12243	3.35355
4	2.17198	3.45918	4.39896	6.74594
8	1.85788	7.99066	10.0676	21.3572

批大小	翻译/秒	p90	p95	p99
1	4.37683	0.414768	0.517834	0.759145
2	5.4154	0.663533	0.819802	1.23272
4	5.96761	1.22273	1.48368	2.36086
8	5.7154	2.50084	3.12651	6.48309

批大小	翻译/秒	p90	p95	p99
1	0.861362	2.28656	2.94149	4.85821
2	0.823048	4.53509	5.8112	9.48938
4	0.737782	9.65253	11.6542	26.505
8	0.59959	22.9913	28.8697	82.7096

批大小	翻译/秒	p90	p95	p99
1	1.93279	0.953545	1.20484	1.78631
2	2.16947	1.69474	2.15922	3.07335
4	2.1769	3.41132	3.81357	8.07259
8	1.93176	6.8895	8.9261	24.9437

批大小	翻译/秒	p90	p95	p99
1	0.684538	3.09814	3.81578	6.27284
2	0.599741	6.23943	8.01769	11.9107
4	0.513848	13.9317	17.508	27.7458
8	0.417179	32.4094	40.6902	61.3091

批大小	翻译/秒	p90	p95	p99
1	1.63386	1.22195	1.43472	2.29943
2	1.64417	2.11811	2.69449	4.09144
4	1.54665	4.54387	5.85887	8.87689
8	1.34448	9.70162	12.994	18.5626

批大小	翻译/秒	p90	p95	p99
1	1.16315	1.59966	2.1086	3.59875
2	1.13787	3.24684	4.27935	7.42329
4	1.02714	7.01515	8.64651	21.3569
8	0.849188	16.4425	23.7179	63.3141

批大小	翻译/秒	p90	p95	p99
1	2.48866	0.698434	0.873312	1.46331
2	2.90332	1.18714	1.57919	2.60135
4	2.94183	2.43637	2.94774	6.64642
8	2.60679	5.19383	6.95298	22.612

批大小	翻译/秒	p90	p95	p99
1	1.13071	1.80933	2.35546	4.05845
2	1.05317	3.68272	4.83116	8.70658
4	0.926311	8.33014	10.8433	18.951
8	0.739266	20.078	27.3122	49.1276

批大小	翻译/秒	p90	p95	p99
1	2.49622	0.756469	0.984338	1.46414
2	2.78937	1.29538	1.70051	2.78291
4	2.76504	2.64809	3.40311	6.25028
8	2.40409	5.96265	7.4472	14.3167

批大小	翻译/秒	p90	p95	p99
1	1.50597	1.18644	1.51743	2.16975
2	1.57968	2.28864	2.6981	3.52617
4	1.51542	4.4258	5.33622	6.82319
8	1.32751	9.80431	10.922	13.7977

批大小	翻译/秒	p90	p95	p99
1	3.08036	0.559041	0.661339	0.91038
2	3.84908	0.85711	1.04328	1.29883
4	4.21956	1.56358	1.82482	2.33023
8	4.10482	3.13583	3.45889	4.6017

批大小	翻译/秒	p90	p95	p99
1	1.98255	0.941924	1.10776	1.54144
2	2.13338	1.68526	2.02845	2.70426
4	2.05743	3.31337	3.86179	5.27319
8	1.88559	6.86031	8.22887	10.5203

批大小	翻译/秒	p90	p95	p99
1	3.65148	0.483885	0.557442	0.729581
2	4.73802	0.699121	0.821801	1.07373
4	5.49724	1.17935	1.33368	1.73064
8	5.72313	2.18095	2.58194	3.10304

批大小	翻译/秒	p90	p95	p99
1	1.41248	1.28643	1.58791	2.3139
2	1.47108	2.34478	2.83111	4.06956
4	1.4002	4.70209	5.24106	11.3531
8	1.23508	9.63668	11.6575	27.5654

批大小	翻译/秒	p90	p95	p99
1	2.82849	0.605161	0.706516	0.984086
2	3.54874	0.904413	1.06932	1.47517
4	3.95	1.54507	1.74233	3.92799
8	3.8328	2.96823	3.76638	8.30336

批大小	翻译/秒	p90	p95	p99
1	2.17267	0.835629	1.08986	1.74998
2	2.31358	1.60007	1.96889	3.65219
4	2.19739	3.22685	4.18122	7.30805
8	1.85197	7.583	9.43079	15.1331

批大小	翻译/秒	p90	p95	p99
1	4.34119	0.420374	0.49482	0.740334
2	5.38064	0.625953	0.786999	1.37539
4	5.88058	1.1504	1.45698	2.39157
8	5.53478	2.31317	3.04514	4.60673

批大小	翻译/秒	p90	p95	p99
1	3.2334	0.550602	0.687886	0.977464
2	4.37697	0.80362	0.992607	1.44542
4	5.37386	1.35522	1.54934	2.46112
8	5.69454	2.44413	2.98448	5.88268

批大小	翻译/秒	p90	p95	p99
1	4.65074	0.388242	0.486017	0.696912
2	6.12378	0.589178	0.727783	1.02505
4	7.89292	0.867871	0.974921	1.52251
8	10.3611	1.27756	1.54294	2.79251

批大小	翻译/秒	p90	p95	p99
1	3.2993	0.550138	0.707322	1.05159
2	4.27656	0.817859	0.979324	1.45333
4	5.34844	1.27252	1.5805	2.40301
8	5.74649	2.39875	2.98626	5.94613

批大小	翻译/秒	p90	p95	p99
1	5.21432	0.347416	0.42621	0.635651
2	6.83885	0.529824	0.650808	0.937024
4	8.61389	0.78888	0.910407	1.32496
8	11.6178	1.15386	1.40679	2.73856

批大小	翻译/秒	p90	p95	p99
1	1.77741	0.990985	1.21668	1.81001
2	2.31417	1.46882	1.84543	2.79646
4	2.51358	2.7443	3.35964	7.01354
8	2.35249	5.72773	7.21471	20.5202

批大小	翻译/秒	p90	p95	p99
1	2.755	0.635924	0.796485	1.06443
2	3.7953	0.882536	1.06826	1.53421
4	4.86703	1.3944	1.55437	3.12095
8	5.30878	2.38393	3.00443	8.34979

批大小	翻译/秒	p90	p95	p99
1	1.52934	1.24096	1.43218	2.21191
2	1.81672	1.86336	2.36406	3.53122
4	1.75764	3.94937	4.75505	7.60036
8	1.62238	8.25034	10.7824	15.3854

批大小	翻译/秒	p90	p95	p99
1	1.97639	0.993974	1.1586	1.77802
2	2.26874	1.44688	1.73429	2.31524
4	2.87353	2.21428	2.78125	4.01438
8	3.16902	4.01227	5.37885	7.6125

批大小	翻译/秒	p90	p95	p99
1	1.92284	0.899713	1.11826	1.69963
2	2.40285	1.412	1.81504	2.75939
4	2.73197	2.50003	2.99643	6.72971
8	2.83331	4.72766	6.49547	17.3474

批大小	翻译/秒	p90	p95	p99
1	3.59883	0.483478	0.595666	0.898467
2	4.9379	0.653637	0.82053	1.2187
4	6.45685	1.02618	1.20368	2.61898
8	6.91838	1.82607	2.4344	7.80098

批大小	翻译/秒	p90	p95	p99
1	1.77906	1.07049	1.32399	1.97101
2	2.22393	1.55067	1.9719	3.29306
4	2.47586	2.94667	3.75548	6.15017
8	2.43233	6.41746	7.66797	14.0245

批大小	翻译/秒	p90	p95	p99
1	2.96545	0.632167	0.813628	1.22926
2	3.61431	0.991024	1.21636	1.86527
4	4.51545	1.47149	1.79279	2.94994
8	5.34795	2.5231	3.0882	5.98196

批大小	翻译/秒	p90	p95	p99
1	2.64088	0.650181	0.765371	0.997787
2	3.64097	0.892604	1.01216	1.26167
4	4.48654	1.3902	1.63337	2.10706
8	4.77718	2.58385	2.82955	3.48874

批大小	翻译/秒	p90	p95	p99
1	3.59036	0.480274	0.554586	0.759074
2	4.76641	0.672895	0.789298	0.989594
4	6.31577	0.951825	1.08554	1.29986
8	8.38796	1.44277	1.5598	1.96256

批大小	翻译/秒	p90	p95	p99
1	2.91999	0.622117	0.72383	0.952387
2	3.9177	0.816498	0.948382	1.20582
4	4.97652	1.27706	1.46059	1.93017
8	5.64668	2.11736	2.40798	3.46252

批大小	翻译/秒	p90	p95	p99
1	4.90299	0.357118	0.415125	0.552237
2	6.46383	0.518696	0.604261	0.776406
4	8.13892	0.762102	0.829806	1.01754
8	11.4851	1.02806	1.16382	1.35881

批大小	翻译/秒	p90	p95	p99
1	2.27099	0.755645	0.886571	1.20483
2	3.01861	1.06715	1.21863	1.61451
4	3.74806	1.60746	1.7861	3.55503
8	4.09461	2.78582	3.22593	7.44492

批大小	翻译/秒	p90	p95	p99
1	4.24781	0.394791	0.457755	0.618395
2	6.10338	0.499393	0.566696	0.756076
4	8.56326	0.676044	0.743654	1.46097
8	10.2352	1.08839	1.32189	2.73462

批大小	翻译/秒	p90	p95	p99
1	3.5106	0.506789	0.619169	0.908319
2	4.45325	0.756633	0.907476	1.57172
4	5.18329	1.30516	1.63934	2.78651
8	5.50329	2.2981	2.83364	4.25098

批大小	翻译/秒	p90	p95	p99
1	5.9993	0.294168	0.348065	0.478454
2	8.65442	0.375508	0.447851	0.726353
4	11.8335	0.521843	0.63013	1.0021
8	14.3675	0.858767	1.07544	1.59066

批大小	翻译/秒	p90	p95	p99
1	3.15864	0.579075	0.747911	1.11383
2	3.97362	0.891704	1.12077	1.619
4	4.9361	1.46578	1.70614	2.77081
8	5.55913	2.4826	3.14398	5.92467

批大小	翻译/秒	p90	p95	p99
1	5.57497	0.322533	0.40781	0.583023
2	7.26353	0.48567	0.602903	0.83862
4	8.96989	0.786287	0.888088	1.46926
8	11.0623	1.15461	1.33785	2.26919

批大小	翻译/秒	p90	p95	p99
1	3.53225	0.516966	0.667599	0.99802
2	4.5487	0.77821	0.942082	1.37171
4	5.6648	1.21424	1.51545	2.24468
8	6.3581	2.18067	2.73047	5.3821

批大小	翻译/秒	p90	p95	p99
1	5.95531	0.305608	0.371901	0.544443
2	8.00066	0.437801	0.546474	0.775757
4	9.8018	0.699556	0.835579	1.2475
8	12.031	1.08207	1.26601	2.13029

批大小	翻译/秒	p90	p95	p99
1	1.60764	1.12706	1.38985	2.09557
2	1.97217	1.80816	2.29783	3.47563
4	2.22006	2.91419	3.45962	7.20265
8	2.39014	5.49412	6.67313	18.3669

批大小	翻译/秒	p90	p95	p99
1	2.70072	0.659295	0.826802	1.16464
2	3.44425	1.01532	1.25013	1.74792
4	4.03099	1.74167	1.93805	3.33269
8	4.98337	2.33654	2.96145	7.24896

批大小	翻译/秒	p90	p95	p99
1	1.46274	1.33128	1.60916	2.47526
2	1.65975	2.04379	2.56163	3.62532
4	1.71584	4.15102	5.17863	7.8878
8	1.60848	8.26861	10.0171	14.0155

批大小	翻译/秒	p90	p95	p99
1	1.91628	1.05569	1.23192	1.96766
2	2.18353	1.45289	1.72764	2.31116
4	2.97416	2.09835	2.54997	3.48024
8	3.80057	3.24333	4.19796	5.89732

批大小	翻译/秒	p90	p95	p99
1	2.37773	0.727434	0.905572	1.38783
2	3.10761	1.10738	1.40704	2.27808
4	3.58859	1.91252	2.26839	4.99117
8	3.76303	3.59959	4.93836	12.8492

批大小	翻译/秒	p90	p95	p99
1	3.666	0.481567	0.597375	0.943018
2	4.75075	0.707917	0.894241	1.39765
4	5.6449	1.22141	1.43054	2.61571
8	6.82322	1.76388	2.29166	6.3953

批大小	翻译/秒	p90	p95	p99
1	2.01985	0.959153	1.22203	1.83839
2	2.43081	1.44771	1.81355	2.96657
4	2.81947	2.50333	3.17918	5.13855
8	2.89113	5.45929	6.32327	11.4377

批大小	翻译/秒	p90	p95	p99
1	2.57608	0.680216	0.818874	1.0967
2	3.36544	0.991269	1.12542	1.41436
4	4.22032	1.46675	1.71882	2.08546
8	4.97375	2.43117	2.77102	3.34274

批大小	翻译/秒	p90	p95	p99
1	3.61789	0.493937	0.578081	0.756098
2	4.68429	0.708449	0.839931	1.08197
4	5.62908	1.12345	1.27338	1.64845
8	6.83994	1.76031	2.0455	2.74362

批大小	翻译/秒	p90	p95	p99
1	2.46593	0.701789	0.827864	1.12114
2	3.23881	0.998848	1.17085	1.64783
4	3.74483	1.66764	1.8855	3.25819
8	4.07184	2.86158	3.37836	7.55776

批大小	翻译/秒	p90	p95	p99
1	3.59471	0.509529	0.642918	0.978406
2	4.56302	0.742774	0.89336	1.50895
4	5.67197	1.18529	1.47249	2.40362
8	6.25461	2.05933	2.55942	3.80992

批大小	翻译/秒	p90	p95	p99
1	4.12313	0.427304	0.53433	0.768236
2	5.48275	0.635833	0.794998	1.15334
4	7.11136	0.994848	1.1373	1.72443
8	8.39331	1.66581	2.06189	3.77933

批大小	翻译/秒	p90	p95	p99
1	4.85223	0.359963	0.45623	0.673122
2	6.37425	0.552072	0.679336	1.00852
4	7.94716	0.860266	1.07731	1.53175
8	9.55766	1.44704	1.85465	3.48685

批大小	翻译/秒	p90	p95	p99
1	2.1678	0.833546	1.05094	1.52679
2	2.74277	1.24674	1.52583	2.30358
4	3.34032	2.00203	2.34845	4.79463
8	3.53087	3.73958	4.60307	12.5865

批大小	翻译/秒	p90	p95	p99
1	1.767	1.12863	1.34114	2.03644
2	2.0191	1.66114	2.05144	2.75675
4	2.40332	2.76886	3.2491	4.96668
8	2.40915	5.3865	6.71841	9.92201

批大小	翻译/秒	p90	p95	p99
1	2.7317	0.625948	0.789122	1.21935
2	3.47458	0.983388	1.23262	1.80345
4	4.20763	1.59159	1.85561	4.07963
8	4.77508	2.84517	3.88936	9.70698

批大小	翻译/秒	p90	p95	p99
1	2.78135	0.663735	0.839735	1.31964
2	3.41445	1.04729	1.30665	2.06958
4	4.08048	1.69358	2.14804	3.56307
8	4.34402	3.21374	4.3626	7.67813

批大小	翻译/秒	p90	p95	p99
1	3.14865	0.544392	0.644859	0.866182
2	4.13298	0.789677	0.911714	1.14556
4	5.51655	1.09958	1.27949	1.55856
8	6.64292	1.90131	2.07456	2.60142

批大小	翻译/秒	p90	p95	p99
1	4.46835	0.382693	0.446626	0.591473
2	6.0414	0.542851	0.635168	0.809197
4	7.95594	0.775596	0.882262	1.12801
8	10.1626	1.2107	1.40238	1.77787

批大小	翻译/秒	p90	p95	p99
1	3.19533	0.52889	0.618372	0.829448
2	4.29364	0.743486	0.859277	1.16369
4	5.55341	1.06916	1.19984	2.2441
8	6.65258	1.71731	2.05993	4.44859

批大小	翻译/秒	p90	p95	p99
1	4.92164	0.351046	0.435042	0.654086
2	6.44019	0.53218	0.62938	1.07707
4	8.20104	0.797411	0.987716	1.63611
8	9.56917	1.37343	1.68147	2.60043

批大小	翻译/秒	p90	p95	p99
1	3.21161	0.551881	0.699054	1.04645
2	3.94197	0.935331	1.20313	1.79741
4	4.21258	1.81462	2.10819	3.3977
8	3.74777	3.95393	5.05185	9.94092

批大小	翻译/秒	p90	p95	p99
1	3.67984	0.482365	0.611687	0.915516
2	4.56324	0.811608	1.00837	1.54823
4	4.81646	1.48052	1.91597	2.93366
8	4.3196	3.44009	4.35453	9.19637

批大小	翻译/秒	p90	p95	p99
1	1.59269	1.13989	1.42803	2.22143
2	1.79704	1.98854	2.51032	3.96387
4	1.76571	3.86337	4.83052	11.2775
8	1.41923	9.75509	12.1954	34.1805

批大小	翻译/秒	p90	p95	p99
1	1.30752	1.50411	1.84256	2.93256
2	1.33787	2.65777	3.41861	4.93037
4	1.22027	5.86512	7.35973	11.8904
8	0.962878	14.1898	17.6757	25.9207

批大小	翻译/秒	p90	p95	p99
1	2.10063	0.833015	1.0545	1.74262
2	2.38958	1.47246	1.92684	3.19599
4	2.37332	2.95373	3.60381	9.31513
8	1.96246	7.24863	10.2259	27.1384

批大小	翻译/秒	p90	p95	p99
1	2.03878	0.915262	1.17286	1.90864
2	2.2491	1.65231	2.14738	3.65678
4	2.15362	3.46958	4.50109	8.08933
8	1.70691	8.69783	11.9667	21.2674

批大小	翻译/秒	p90	p95	p99
1	2.49235	0.6842	0.82349	1.10687
2	3.0999	1.10442	1.27725	1.64118
4	3.39072	1.91736	2.27719	2.85924
8	3.06498	4.28937	4.81914	6.06737

批大小	翻译/秒	p90	p95	p99
1	3.27249	0.528369	0.617929	0.825152
2	4.17705	0.817047	0.965819	1.2789
4	4.58916	1.42173	1.64031	2.21803
8	4.46334	2.91317	3.49222	4.7206

批大小	翻译/秒	p90	p95	p99
1	2.49235	0.6842	0.82349	1.10687
2	3.0999	1.10442	1.27725	1.64118
4	3.39072	1.91736	2.27719	2.85924
8	3.06498	4.28937	4.81914	6.06737

批大小	翻译/秒	p90	p95	p99
1	3.65367	0.484444	0.594397	0.895525
2	4.51427	0.784022	0.952965	1.71321
4	4.82297	1.40188	1.78353	3.22977
8	4.33621	3.15064	3.87317	6.70363

批大小	翻译/秒	p90	p95	p99
1	5.53244	0.321538	0.401512	0.572019
2	7.50883	0.462796	0.575228	0.852386
4	9.49473	0.761396	0.885352	1.34316
8	9.7493	1.48582	1.87156	3.63922

批大小	翻译/秒	p90	p95	p99
1	6.49662	0.272523	0.344392	0.491953
2	8.83522	0.390061	0.475191	0.712326
4	11.1264	0.616684	0.776105	1.14432
8	12.1215	1.15496	1.44255	3.10698

批大小	翻译/秒	p90	p95	p99
1	2.83294	0.627614	0.777672	1.11164
2	3.67989	0.929658	1.1624	1.7504
4	4.25566	1.53396	1.92035	4.25017
8	3.78816	3.61568	4.50804	12.3602

批大小	翻译/秒	p90	p95	p99
1	2.50376	0.759646	0.902159	1.33215
2	2.95287	1.16109	1.45138	1.98364
4	3.23427	2.06359	2.47434	3.86486
8	2.7604	4.89755	6.08487	8.90458

批大小	翻译/秒	p90	p95	p99
1	3.55964	0.482476	0.60212	0.903771
2	4.62327	0.726833	0.944778	1.4199
4	5.4368	1.2452	1.46275	3.55199
8	5.19614	2.70353	3.76078	9.97643

批大小	翻译/秒	p90	p95	p99
1	3.62492	0.508439	0.635317	0.972587
2	4.55915	0.77493	0.964303	1.59576
4	5.18724	1.35533	1.76789	3.05251
8	4.66844	3.12152	4.22893	7.515

批大小	翻译/秒	p90	p95	p99
1	4.53686	0.379011	0.444788	0.591646
2	6.19031	0.522951	0.6055	0.768655
4	7.75818	0.81051	0.954429	1.17093
8	8.07276	1.6116	1.80494	2.28147

批大小	翻译/秒	p90	p95	p99
1	5.77071	0.300281	0.349956	0.464621
2	8.08293	0.398271	0.468476	0.597293
4	10.5873	0.595187	0.691468	0.903932
8	12.3195	1.00189	1.17135	1.48395

批大小	翻译/秒	p90	p95	p99
1	4.26907	0.398147	0.464882	0.622171
2	5.83736	0.538334	0.61753	0.871099
4	7.41747	0.816157	0.932301	1.7867
8	7.58242	1.56587	1.89295	4.35962

批大小	翻译/秒	p90	p95	p99
1	6.33491	0.277237	0.338647	0.496138
2	8.49444	0.391777	0.461043	0.795444
4	10.6513	0.615139	0.760603	1.34253
8	11.1476	1.22908	1.50663	2.42285

硬件规格#

GPU
NVIDIA DGX A100 40 GB
CPU
型号	AMD EPYC 7742 64 核处理器
每核线程数	2
插槽数	2
每插槽核心数	64
NUMA 节点数	8
频率加速	已启用
CPU 最大 MHz	2250
CPU 最小 MHz	1500
RAM
型号	Micron DDR4 36ASF8G72PZ-3G2B2 3200MHz
配置的内存速度	2933 MT/s
RAM 大小	32x64GB (总共 2048GB)

GPU
NVIDIA A40
CPU
型号	AMD EPYC 7763 64 核处理器
每核线程数	1
插槽数	2
每插槽核心数	64
NUMA 节点数	8
频率加速	已启用
CPU 最大 MHz	3529
CPU 最小 MHz	1500
RAM
型号	Samsung DDR4 M393A4K40DB3-CWE 3200MHz
配置的内存速度	3200 MT/s
RAM 大小	16x32GB (总共 512GB)

GPU
NVIDIA A30
CPU
型号	AMD EPYC 7742 64 核处理器
每核线程数	1
插槽数	2
每插槽核心数	64
NUMA 节点数	2
频率加速	已禁用
CPU 最大 MHz	2250.0000
CPU 最小 MHz	1500.0000
RAM
型号	Samsung DDR4 M393A4K40DB3-CWE 3200MHz
配置的内存速度	3200 MT/s
RAM 大小	32x64GB (总共 2048GB)

GPU
NVIDIA A10
CPU
型号	AMD EPYC 7763 64 核处理器
每核线程数	1
插槽数	2
每插槽核心数	64
NUMA 节点数	8
频率加速	已启用
CPU 最大 MHz	2450
CPU 最小 MHz	1500
RAM
型号	Samsung DDR4 M393A4K40DB3-CWE 3200 MHz
配置的内存速度	3200 MT/s
RAM 大小	16x32GB (总共 512GB)

GPU
NVIDIA H100 80GB HBM3
CPU
型号	Intel(R) Xeon(R) Platinum 8480CL
每核线程数	2
插槽数	2
每插槽核心数	56
NUMA 节点数	2
CPU 最大 MHz	3800
CPU 最小 MHz	800
RAM
型号	Micron DDR5 MTC40F2046S1RC48BA1 4800MHz
配置的内存速度	4400 MT/s
RAM 大小	32x64GB (总共 2048GB)

GPU
NVIDIA V100 SXM2 16 GB
CPU
型号	Intel(R) Xeon(R) CPU E5-2698 v4 @ 2.20GHz
每核线程数	2
插槽数	2
每插槽核心数	20
NUMA 节点数	2
CPU 最大 MHz	3600
CPU 最小 MHz	1200
RAM
型号	Micron DDR4 36ASF4G72PZ-2G6D1 2667MHz
配置的内存速度	2133 MT/s
RAM 大小	16x32GB (总共 512GB)

GPU
NVIDIA T4
CPU
型号	Intel(R) Xeon(R) Gold 6240 CPU @ 2.60GHz
每核线程数	2
插槽数	2
每插槽核心数	18
NUMA 节点数	2
CPU 最大 MHz	3900
CPU 最小 MHz	1000
RAM
型号	Samsung DDR4 M393A2K43BB1-CTD 2666MHz
配置的内存速度	2666 MT/s
RAM 大小	24x16GB (总共 384GB)

GPU
NVIDIA L4
CPU
型号	AMD EPYC 7763 64 核处理器
每核线程数	1
插槽数	2
每插槽核心数	64
NUMA 节点数	8
频率加速	已启用
CPU 最大 MHz	3529
CPU 最小 MHz	1500
RAM
型号	Samsung DDR4 M393A4K40DB3-CWE 3200MHz
配置的内存速度	3200 MT/s
RAM 大小	16x32GB (总共 512GB)

GPU
NVIDIA L40
CPU
型号	AMD EPYC 7763 64 核处理器
每核线程数	1
插槽数	2
每插槽核心数	64
NUMA 节点数	8
频率加速	已启用
CPU 最大 MHz	3529
CPU 最小 MHz	1500
RAM
型号	Samsung DDR4 M393A4K40DB3-CWE 3200MHz
配置的内存速度	3200 MT/s
RAM 大小	16x32GB (总共 512GB)

NVIDIA Riva

性能

目录

性能#

评估流程#

结果#

硬件规格#

批大小	翻译/秒	p90	p95	p99
1	3.58881	0.517707	0.664048	0.961796
2	4.69768	0.753773	0.916464	1.3947
4	5.55838	1.24359	1.53361	2.37456
8	6.37432	2.01374	2.3751	4.29599

批大小	翻译/秒	p90	p95	p99
1	4.21699	0.407389	0.471445	0.643416
2	5.68254	0.562732	0.666155	0.830713
4	7.05958	0.875766	0.999967	1.22123
8	8.85376	1.29086	1.37358	1.67576

批大小	翻译/秒	p90	p95	p99
1	5.49199	0.320974	0.365606	0.475707
2	7.64704	0.432576	0.508012	0.648441
4	9.20929	0.680454	0.757157	0.944544
8	11.8699	0.973726	1.08388	1.23339

批大小	翻译/秒	p90	p95	p99
1	4.10508	0.412319	0.47599	0.666765
2	5.57421	0.565126	0.664104	0.888657
4	6.85552	0.851162	0.952348	1.82384
8	8.63855	1.21461	1.39357	2.64959

批大小	翻译/秒	p90	p95	p99
1	6.31404	0.28932	0.345072	0.500795
2	8.26151	0.401525	0.491668	0.810438
4	10.4726	0.612379	0.750257	1.19928
8	12.1402	0.987194	1.16206	1.61063

批大小	翻译/秒	p90	p95	p99
1	5.65425	0.315126	0.383131	0.535653
2	7.85343	0.433272	0.531824	0.843105
4	11.0764	0.611641	0.681495	1.06503
8	15.2471	0.846886	1.02084	1.79664

批大小	翻译/秒	p90	p95	p99
1	6.4463	0.279807	0.342423	0.500049
2	8.63103	0.396385	0.477411	0.72539
4	12.0895	0.550278	0.648501	0.933581
8	15.9104	0.82799	1.02193	1.87855

批大小	翻译/秒	p90	p95	p99
1	2.90025	0.59671	0.742885	1.00865
2	3.99287	0.841249	1.02143	1.35269
4	5.44496	1.21855	1.29596	2.40566
8	6.84585	1.79705	2.26444	5.77462

批大小	翻译/秒	p90	p95	p99
1	2.58519	0.753912	0.85802	1.3189
2	3.25867	0.987321	1.18477	1.61445
4	4.29676	1.4426	1.77894	2.58723
8	4.86628	2.52367	3.28442	4.54688

批大小	翻译/秒	p90	p95	p99
1	3.53882	0.492874	0.612278	0.909837
2	4.91086	0.672804	0.83147	1.23589
4	6.58691	0.983939	1.14903	2.17641
8	8.22212	1.54826	2.03955	5.82175

批大小	翻译/秒	p90	p95	p99
1	3.86296	0.475928	0.600187	0.863856
2	5.09748	0.673883	0.811793	1.21204
4	6.79687	0.979856	1.16703	1.92093
8	7.90041	1.72682	2.05182	3.65052

批大小	翻译/秒	p90	p95	p99
1	4.74117	0.359799	0.417139	0.553561
2	6.66495	0.465726	0.535429	0.66016
4	9.37342	0.636747	0.727977	0.883265
8	12.4516	0.95654	1.0442	1.32968

批大小	翻译/秒	p90	p95	p99
1	5.65473	0.308275	0.351662	0.451586
2	8.02538	0.397253	0.45913	0.581759
4	11.113	0.546807	0.610054	0.750217
8	15.81	0.736274	0.859263	1.05405

批大小	翻译/秒	p90	p95	p99
1	4.34078	0.392213	0.452213	0.627779
2	6.06894	0.507281	0.57604	0.806999
4	8.50215	0.67566	0.750771	1.37582
8	11.1483	0.968451	1.16764	2.32105

批大小	翻译/秒	p90	p95	p99
1	6.54125	0.274269	0.321837	0.457731
2	8.85565	0.360549	0.432293	0.69387
4	12.071	0.511326	0.62468	1.32251
8	15.3082	0.844161	1.22033	1.80721

批大小	翻译/秒	p90	p95	p99
1	4.3558	0.406586	0.503963	0.716661
2	5.92087	0.592542	0.730759	1.03603
4	7.44743	0.931731	1.05387	1.76271
8	8.62293	1.54459	1.86076	3.56028

批大小	翻译/秒	p90	p95	p99
1	5.21316	0.342154	0.416989	0.597106
2	7.06807	0.47894	0.600551	0.847326
4	9.07727	0.757023	0.901351	1.337
8	10.1944	1.33826	1.63629	3.17998

批大小	翻译/秒	p90	p95	p99
1	2.33	0.752815	0.953063	1.32369
2	3.00598	1.14895	1.43916	1.94344
4	3.58665	1.9061	2.15686	4.24684
8	3.68764	3.47671	4.47942	12.7402

批大小	翻译/秒	p90	p95	p99
1	2.07023	0.925934	1.07785	1.63396
2	2.41131	1.36788	1.68478	2.35691
4	2.74236	2.4176	3.03828	4.39499
8	2.69037	4.7693	6.35519	9.15609

批大小	翻译/秒	p90	p95	p99
1	2.9563	0.587727	0.733097	1.13274
2	3.86728	0.865855	1.10648	1.70859
4	4.60656	1.49447	1.79158	3.65963
8	4.62695	2.82301	3.70218	12.185

批大小	翻译/秒	p90	p95	p99
1	2.94225	0.612871	0.77307	1.15619
2	3.7828	0.943779	1.13484	1.73097
4	4.5197	1.537	1.88779	3.24108
8	4.62755	2.9523	3.59704	7.23216

批大小	翻译/秒	p90	p95	p99
1	3.6767	0.459	0.526907	0.707111
2	5.03464	0.628305	0.738799	0.925534
4	6.43002	0.97241	1.11052	1.35814
8	7.52526	1.65002	1.78985	2.31809

批大小	翻译/秒	p90	p95	p99
1	4.57559	0.376581	0.429402	0.55051
2	6.5038	0.498671	0.58124	0.736388
4	8.14191	0.768947	0.865685	1.08983
8	9.65334	1.25773	1.4512	1.70824

批大小	翻译/秒	p90	p95	p99
1	3.42751	0.487332	0.562558	0.761679
2	4.68272	0.667619	0.760011	1.04616
4	5.99478	0.980249	1.09456	2.22251
8	6.75914	1.63513	2.00401	4.28315

批大小	翻译/秒	p90	p95	p99
1	4.9919	0.356661	0.423563	0.6014
2	6.65304	0.482162	0.598729	0.995661
4	8.5894	0.767167	0.904148	1.42255
8	9.56211	1.29651	1.66069	2.40959

批大小	翻译/秒	p90	p95	p99
1	9.08686	0.193362	0.24324	0.347191
2	12.4436	0.275575	0.340496	0.483739
4	16.5848	0.416214	0.481659	0.778036
8	21.4718	0.626537	0.769537	1.39637

批大小	翻译/秒	p90	p95	p99
1	10.4708	0.170403	0.207211	0.307452
2	14.3399	0.238596	0.292291	0.421036
4	19.1232	0.349187	0.42351	0.637148
8	24.9874	0.531043	0.663098	1.23383

批大小	翻译/秒	p90	p95	p99
1	4.64454	0.382023	0.472406	0.661519
2	6.32129	0.540562	0.64564	0.916441
4	8.07032	0.841756	0.928499	1.75539
8	9.28366	1.33046	1.79387	5.10661

批大小	翻译/秒	p90	p95	p99
1	4.11115	0.461011	0.530609	0.796084
2	5.10799	0.623855	0.769704	1.06166
4	6.28199	1.01825	1.25504	1.78332
8	6.93842	1.83976	2.47694	3.56565

批大小	翻译/秒	p90	p95	p99
1	6.06705	0.287592	0.356108	0.531268
2	8.10223	0.411733	0.518182	0.752038
4	10.414	0.643502	0.743483	1.41429
8	12.3754	1.0469	1.41356	4.05743