选择合适的 NVIDIA GPU 虚拟化软件
NVIDIA GPU 虚拟化软件产品针对不同类型的工作负载进行了优化。因此,您应根据用户正在运行的工作负载选择合适的 NVIDIA GPU 虚拟化软件产品。
下表总结了各种 NVIDIA GPU 虚拟化软件产品在功能上的差异。
功能 |
NVIDIA RTX vWS |
NVIDIA vPC |
---|---|---|
Windows 操作系统支持 | ✔ | ✔ |
Linux 操作系统支持 | ✔ | ✔ |
NVIDIA 显卡驱动程序 | ✔ | ✔ |
NVIDIA RTX 企业驱动程序 | ✔ | |
每个 VM/NVLink 多个 vGPU | ✔ | |
ECC 报告和处理 | ✔ | |
页面停用 | ✔ |
功能 |
NVIDIA RTX vWS |
NVIDIA vPC |
---|---|---|
最大硬件渲染显示器 |
|
|
最大分辨率 | 7680×4302 | 5120×2880 |
最大像素计数 | 66,355,200 | 17,694,720 |
功能 |
NVIDIA RTX vWS |
NVIDIA vPC |
---|---|---|
ISV 认证 | ✔ | |
NVIDIA CUDA Toolkit/OpenCL 支持 | ✔ |
功能 |
NVIDIA RTX vWS |
NVIDIA vPC |
---|---|---|
NVENC | ✔ | ✔ |
OpenGL 扩展(WebGL) | ✔ | ✔ |
RTX 平台优化 | ✔ | |
DirectX | ✔ | ✔ |
Vulkan 支持 | ✔ |
有关每个受支持 GPU 的可用配置文件的详细信息,请参阅 vGPU 用户指南。
表 13 显示了 NVIDIA GPU 虚拟化软件产品针对优化的不同类型的图形工作负载。
工作负载 |
GPU 虚拟化软件 |
---|---|
知识型员工 VDI | NVIDIA Virtual PC (vPC) |
专业图形 | NVIDIA RTX Virtual Workstation (vWS) |
每个 NVIDIA GPU 虚拟化软件产品都专为特定类型的工作负载而设计。
NVIDIA Virtual PC
NVIDIA Virtual PC (vPC) 软件专为知识型员工 VDI 工作负载而设计,旨在加速以下软件和外围设备
办公效率应用程序
流媒体视频
Windows 操作系统
多显示器
高分辨率显示器
2D 电气设计自动化 (EDA)
NVIDIA RTX Virtual Workstation
NVIDIA RTX Virtual Workstation (RTX vWS) 软件专为专业图形工作负载而设计,这些工作负载受益于以下 NVIDIA RTX vWS 功能
RTX 企业平台驱动程序和 ISV 认证
支持 NVIDIA® CUDA® Toolkit 和 OpenCL
更高分辨率的显示器
具有更大帧缓冲区容量的 vGPU 配置文件
NVIDIA RTX vWS 加速专业设计和可视化应用程序,例如
Autodesk Revit
达索系统 CATIA
Esri ArcGIS Pro
Maya
Petrel
Solidworks
使用 NVIDIA vGPU 软件在多个虚拟机之间共享 GPU 可以提高 GPU 的整体利用率。NVIDIA vGPU 软件默认使用尽力而为 vGPU 调度程序,旨在平衡 vGPU 之间的性能。除了默认调度程序之外,基于 Maxwell 之后 NVIDIA 架构的 GPU 还支持等份额和固定份额 vGPU 调度程序。这些调度策略通过控制 GPU 资源分配给每个 vGPU 的方式,从而实现更可预测和一致的性能。
共享 GPU 的性能分配
通常,当 N 个虚拟机共享一个 GPU 时,每个虚拟机分配到的 GPU 总性能为 1/N。例如
当两个虚拟机共享一个 GPU 时,每个虚拟机分配到大约 50% 的 GPU 总性能。
当四个虚拟机共享一个 GPU 时,每个虚拟机分配到大约 25% 的 GPU 总性能。
GPU 共享的调度选项
为了适应各种服务质量 (QoS) 级别的 GPU 共享,NVIDIA vGPU 软件提供了多个 GPU 调度选项。有关这些 GPU 调度选项的更多信息,请参阅 NVIDIA 虚拟 GPU 软件用户指南中的更改时间分片 vGPU 的调度行为。
尽力而为 GPU 调度程序
默认的尽力而为 GPU 调度策略利用其他虚拟机未使用的 GPU 时间片。当虚拟机之间的工作负载不同时执行,或者并非始终受 GPU 约束时,尽力而为 GPU 调度策略使虚拟机的 GPU 性能份额能够超过其预期份额。图 5 是尽力而为 GPU 调度程序工作原理的简化图示。

图 5 - 尽力而为 GPU 调度程序
GPU 共享对整体吞吐量的影响
为了衡量 GPU 共享对整体吞吐量的影响,SPECviewperf 2020 基准测试在一个分配给单个 VM 的 GPU 上运行,然后在两个和四个 VM 之间共享。
图 6 显示了此测试的结果
对于两个虚拟机,吞吐量提高了 6%。
对于四个虚拟机,吞吐量提高了 8%。

图 6 - GPU 共享对整体吞吐量的影响
吞吐量的这种增加在多 VM 测试场景中很典型。当从单个 VM 扩展到多个 VM 时,VM 的组合吞吐量应超过单个 VM 的几何平均吞吐量。随着分配更多 CPU 资源,吞吐量会提高,在稳定在 1 倍吞吐量左右之前达到峰值。
用于衡量 GPU 共享对整体吞吐量影响的服务器配置在表 14 中列出。
属性 |
值 |
---|---|
服务器 CPU | Intel Xeon Gold 6154(18 核,3.0 GHz) |
服务器 GPU | NVIDIA L40S |
虚拟机管理程序软件 | VMware ESXi 8.0 U1 |
VM vCPU | 8 个 vCPU |
VM vMemory | 16 GB |
VM 客户操作系统 | Windows 11 企业版 |
GPU 虚拟化软件 | NVIDIA RTX vWS |
虚拟 GPU 管理器驱动程序版本 | 535.54.04 |
客户驱动程序版本 | 536.25 |
分辨率 | 3840x2160 |
vGPU 配置文件 | L40S-48Q、L40S-24Q、L40S-12Q |
工作负载 | Specviewperf 2020 |