NVIDIA RTX vWS:虚拟化工作负载的规模调整和 GPU 选择指南

选择合适的 NVIDIA GPU 虚拟化软件

NVIDIA GPU 虚拟化软件产品针对不同类型的工作负载进行了优化。因此,您应根据用户正在运行的工作负载选择合适的 NVIDIA GPU 虚拟化软件产品。

下表总结了各种 NVIDIA GPU 虚拟化软件产品在功能上的差异。

表 9 - NVIDIA GPU 虚拟化软件功能:配置和部署

功能

NVIDIA RTX vWS

NVIDIA vPC

Windows 操作系统支持
Linux 操作系统支持
NVIDIA 显卡驱动程序
NVIDIA RTX 企业驱动程序
每个 VM/NVLink 多个 vGPU
ECC 报告和处理
页面停用
表 10 - NVIDIA GPU 虚拟化软件功能:显示

功能

NVIDIA RTX vWS

NVIDIA vPC

最大硬件渲染显示器
  • 四个 5K
  • 两个 8K
  • 四个 QHD
  • 两个 4K
  • 一个 5K
最大分辨率 7680×4302 5120×2880
最大像素计数 66,355,200 17,694,720
表 11 - NVIDIA GPU 虚拟化软件功能:高级专业功能

功能

NVIDIA RTX vWS

NVIDIA vPC

ISV 认证
NVIDIA CUDA Toolkit/OpenCL 支持
表 12 - NVIDIA GPU 虚拟化软件功能:图形功能和 API

功能

NVIDIA RTX vWS

NVIDIA vPC

NVENC
OpenGL 扩展(WebGL)
RTX 平台优化
DirectX
Vulkan 支持
注意

有关每个受支持 GPU 的可用配置文件的详细信息,请参阅 vGPU 用户指南

表 13 显示了 NVIDIA GPU 虚拟化软件产品针对优化的不同类型的图形工作负载。

表 13 - NVIDIA GPU 虚拟化软件产品的最佳工作负载

工作负载

GPU 虚拟化软件

知识型员工 VDI NVIDIA Virtual PC (vPC)
专业图形 NVIDIA RTX Virtual Workstation (vWS)

每个 NVIDIA GPU 虚拟化软件产品都专为特定类型的工作负载而设计。

NVIDIA Virtual PC

NVIDIA Virtual PC (vPC) 软件专为知识型员工 VDI 工作负载而设计,旨在加速以下软件和外围设备

  • 办公效率应用程序

  • 流媒体视频

  • Windows 操作系统

  • 多显示器

  • 高分辨率显示器

  • 2D 电气设计自动化 (EDA)

NVIDIA RTX Virtual Workstation

NVIDIA RTX Virtual Workstation (RTX vWS) 软件专为专业图形工作负载而设计,这些工作负载受益于以下 NVIDIA RTX vWS 功能

  • RTX 企业平台驱动程序和 ISV 认证

  • 支持 NVIDIA® CUDA® Toolkit 和 OpenCL

  • 更高分辨率的显示器

  • 具有更大帧缓冲区容量的 vGPU 配置文件

NVIDIA RTX vWS 加速专业设计和可视化应用程序,例如

  • Autodesk Revit

  • 达索系统 CATIA

  • Esri ArcGIS Pro

  • Maya

  • Petrel

  • Solidworks

使用 NVIDIA vGPU 软件在多个虚拟机之间共享 GPU 可以提高 GPU 的整体利用率。NVIDIA vGPU 软件默认使用尽力而为 vGPU 调度程序,旨在平衡 vGPU 之间的性能。除了默认调度程序之外,基于 Maxwell 之后 NVIDIA 架构的 GPU 还支持等份额和固定份额 vGPU 调度程序。这些调度策略通过控制 GPU 资源分配给每个 vGPU 的方式,从而实现更可预测和一致的性能。

共享 GPU 的性能分配

通常,当 N 个虚拟机共享一个 GPU 时,每个虚拟机分配到的 GPU 总性能为 1/N。例如

  • 两个虚拟机共享一个 GPU 时,每个虚拟机分配到大约 50% 的 GPU 总性能。

  • 四个虚拟机共享一个 GPU 时,每个虚拟机分配到大约 25% 的 GPU 总性能。

GPU 共享的调度选项

为了适应各种服务质量 (QoS) 级别的 GPU 共享,NVIDIA vGPU 软件提供了多个 GPU 调度选项。有关这些 GPU 调度选项的更多信息,请参阅 NVIDIA 虚拟 GPU 软件用户指南中的更改时间分片 vGPU 的调度行为

尽力而为 GPU 调度程序

默认的尽力而为 GPU 调度策略利用其他虚拟机未使用的 GPU 时间片。当虚拟机之间的工作负载不同时执行,或者并非始终受 GPU 约束时,尽力而为 GPU 调度策略使虚拟机的 GPU 性能份额能够超过其预期份额。图 5 是尽力而为 GPU 调度程序工作原理的简化图示。

vgpu-005.png

图 5 - 尽力而为 GPU 调度程序

GPU 共享对整体吞吐量的影响

为了衡量 GPU 共享对整体吞吐量的影响,SPECviewperf 2020 基准测试在一个分配给单个 VM 的 GPU 上运行,然后在两个和四个 VM 之间共享。

图 6 显示了此测试的结果

  • 对于两个虚拟机,吞吐量提高了 6%

  • 对于四个虚拟机,吞吐量提高了 8%

vgpu-006.png

图 6 - GPU 共享对整体吞吐量的影响

吞吐量的这种增加在多 VM 测试场景中很典型。当从单个 VM 扩展到多个 VM 时,VM 的组合吞吐量应超过单个 VM 的几何平均吞吐量。随着分配更多 CPU 资源,吞吐量会提高,在稳定在 1 倍吞吐量左右之前达到峰值。

用于衡量 GPU 共享对整体吞吐量影响的服务器配置在表 14 中列出。

表 14 - 用于衡量 GPU 共享对整体吞吐量影响的服务器配置

属性

服务器 CPU Intel Xeon Gold 6154(18 核,3.0 GHz)
服务器 GPU NVIDIA L40S
虚拟机管理程序软件 VMware ESXi 8.0 U1
VM vCPU 8 个 vCPU
VM vMemory 16 GB
VM 客户操作系统 Windows 11 企业版
GPU 虚拟化软件 NVIDIA RTX vWS
虚拟 GPU 管理器驱动程序版本 535.54.04
客户驱动程序版本 536.25
分辨率 3840x2160
vGPU 配置文件 L40S-48Q、L40S-24Q、L40S-12Q
工作负载 Specviewperf 2020
上一页 选择合适的 NVIDIA GPU 以进行虚拟化
下一页 规模调整方法
© 版权所有 © 2013-2025 NVIDIA Corporation。 上次更新时间:2025 年 1 月 14 日。