性能分析
密切分析虚拟机上的 GPU 帧缓冲区,以确保尺寸调整正确。如上一节所述,一个好的经验法则是,虚拟机的帧缓冲区使用率不应频繁超过 90% 或平均超过 70%。高利用率可能会导致次优的用户体验,包括性能下降和潜在的崩溃。
下图说明了使用 2Q vGPU 配置文件与 4Q 配置文件的虚拟机中的 vGPU 帧缓冲区 (FB) 使用情况。在本例中,基准测试是 Esri ArcGIS Pro,一个专业的地理空间软件应用程序和空间导航多面片 3D 数据。2Q 虚拟机报告了更长的渲染时间并经历了软件卡顿,而 4Q 虚拟机保持了丰富流畅的最终用户体验和高性能的渲染时间。

图 11 - 虚拟机中的 vGPU 帧缓冲区使用情况
分析主机资源指标以识别多个虚拟机执行工作负载时的潜在瓶颈,对于提供高质量的用户体验至关重要。最成功的部署是在用户密度(可扩展性)和高质量用户体验之间取得平衡的部署。过度利用的服务器资源会显著降低用户体验。下图说明了基准测试在多个虚拟机上扩展时的主机利用率,突出了资源分配和监控对于优化性能的重要性。

图 12 - 多个虚拟机上的主机利用率
图 12 说明了 GPU 利用率,表明没有 GPU 瓶颈。这表明服务器在 GPU 计算引擎内有充足的余量。GPU 利用时间是在服务器中的三个 L40S GPU 上取平均值。虽然在整个测试过程中都保持了 GPU 余量,但 CPU 资源已耗尽,导致 VDI 性能和用户体验受到负面影响。
即使存在虚拟 GPU,为虚拟化选择正确的服务器 CPU 和适当的配置也会直接影响可扩展性。处理器资源通常是超线程的,并在一定程度上过度配置。在 CPU 规格方面,请考虑内核数量和时钟速度。对于 NVIDIA RTX vWS,选择更高的时钟速度而不是更高的内核数量。
NVIDIA RTX vWS 的示例服务器配置在附录项中提供。