选择合适的 NVIDIA GPU 虚拟化软件 - NVIDIA 文档

NVIDIA GPU 虚拟化软件产品针对不同类型的工作负载进行了优化。因此，您应根据用户正在运行的工作负载选择合适的 NVIDIA GPU 虚拟化软件产品。

产品功能摘要

下表总结了各种 NVIDIA GPU 虚拟化软件产品在功能上的差异。

*表 9 - NVIDIA GPU 虚拟化软件功能：配置和部署*
功能	NVIDIA RTX vWS	NVIDIA vPC
Windows 操作系统支持	✔	✔
Linux 操作系统支持	✔	✔
NVIDIA 显卡驱动程序	✔	✔
NVIDIA RTX 企业驱动程序	✔
每个 VM/NVLink 多个 vGPU	✔
ECC 报告和处理	✔
页面停用	✔

*表 10 - NVIDIA GPU 虚拟化软件功能：显示*
功能	NVIDIA RTX vWS	NVIDIA vPC
最大硬件渲染显示器	四个 5K 两个 8K	四个 QHD 两个 4K 一个 5K
最大分辨率	7680×4302	5120×2880
最大像素计数	66,355,200	17,694,720

*表 11 - NVIDIA GPU 虚拟化软件功能：高级专业功能*
功能	NVIDIA RTX vWS	NVIDIA vPC
ISV 认证	✔
NVIDIA CUDA Toolkit/OpenCL 支持	✔

*表 12 - NVIDIA GPU 虚拟化软件功能：图形功能和 API*
功能	NVIDIA RTX vWS	NVIDIA vPC
NVENC	✔	✔
OpenGL 扩展（WebGL）	✔	✔
RTX 平台优化	✔
DirectX	✔	✔
Vulkan 支持	✔

注意

有关每个受支持 GPU 的可用配置文件的详细信息，请参阅 vGPU 用户指南。

最佳工作负载

表 13 显示了 NVIDIA GPU 虚拟化软件产品针对优化的不同类型的图形工作负载。

*表 13 - NVIDIA GPU 虚拟化软件产品的最佳工作负载*
工作负载	GPU 虚拟化软件
知识型员工 VDI	NVIDIA Virtual PC (vPC)
专业图形	NVIDIA RTX Virtual Workstation (vWS)

产品详细信息

每个 NVIDIA GPU 虚拟化软件产品都专为特定类型的工作负载而设计。

NVIDIA Virtual PC

NVIDIA Virtual PC (vPC) 软件专为知识型员工 VDI 工作负载而设计，旨在加速以下软件和外围设备

办公效率应用程序
流媒体视频
Windows 操作系统
多显示器
高分辨率显示器
2D 电气设计自动化 (EDA)

NVIDIA RTX Virtual Workstation

NVIDIA RTX Virtual Workstation (RTX vWS) 软件专为专业图形工作负载而设计，这些工作负载受益于以下 NVIDIA RTX vWS 功能

RTX 企业平台驱动程序和 ISV 认证
支持 NVIDIA® CUDA® Toolkit 和 OpenCL
更高分辨率的显示器
具有更大帧缓冲区容量的 vGPU 配置文件

NVIDIA RTX vWS 加速专业设计和可视化应用程序，例如

Autodesk Revit
达索系统 CATIA
Esri ArcGIS Pro
Maya
Petrel
Solidworks

使用 NVIDIA vGPU 软件在多个虚拟机之间共享 GPU 可以提高 GPU 的整体利用率。NVIDIA vGPU 软件默认使用尽力而为 vGPU 调度程序，旨在平衡 vGPU 之间的性能。除了默认调度程序之外，基于 Maxwell 之后 NVIDIA 架构的 GPU 还支持等份额和固定份额 vGPU 调度程序。这些调度策略通过控制 GPU 资源分配给每个 vGPU 的方式，从而实现更可预测和一致的性能。

共享 GPU 的性能分配

通常，当 N 个虚拟机共享一个 GPU 时，每个虚拟机分配到的 GPU 总性能为 1/N。例如

当两个虚拟机共享一个 GPU 时，每个虚拟机分配到大约 50% 的 GPU 总性能。
当四个虚拟机共享一个 GPU 时，每个虚拟机分配到大约 25% 的 GPU 总性能。

为了适应各种服务质量 (QoS) 级别的 GPU 共享，NVIDIA vGPU 软件提供了多个 GPU 调度选项。有关这些 GPU 调度选项的更多信息，请参阅 NVIDIA 虚拟 GPU 软件用户指南中的更改时间分片 vGPU 的调度行为。

尽力而为 GPU 调度程序

默认的尽力而为 GPU 调度策略利用其他虚拟机未使用的 GPU 时间片。当虚拟机之间的工作负载不同时执行，或者并非始终受 GPU 约束时，尽力而为 GPU 调度策略使虚拟机的 GPU 性能份额能够超过其预期份额。图 5 是尽力而为 GPU 调度程序工作原理的简化图示。

图 5 - 尽力而为 GPU 调度程序

为了衡量 GPU 共享对整体吞吐量的影响，SPECviewperf 2020 基准测试在一个分配给单个 VM 的 GPU 上运行，然后在两个和四个 VM 之间共享。

图 6 显示了此测试的结果

对于两个虚拟机，吞吐量提高了 6%。
对于四个虚拟机，吞吐量提高了 8%。

图 6 - GPU 共享对整体吞吐量的影响

吞吐量的这种增加在多 VM 测试场景中很典型。当从单个 VM 扩展到多个 VM 时，VM 的组合吞吐量应超过单个 VM 的几何平均吞吐量。随着分配更多 CPU 资源，吞吐量会提高，在稳定在 1 倍吞吐量左右之前达到峰值。

用于衡量 GPU 共享对整体吞吐量影响的服务器配置在表 14 中列出。

*表 14 - 用于衡量 GPU 共享对整体吞吐量影响的服务器配置*
属性	值
服务器 CPU	Intel Xeon Gold 6154（18 核，3.0 GHz）
服务器 GPU	NVIDIA L40S
虚拟机管理程序软件	VMware ESXi 8.0 U1
VM vCPU	8 个 vCPU
VM vMemory	16 GB
VM 客户操作系统	Windows 11 企业版
GPU 虚拟化软件	NVIDIA RTX vWS
虚拟 GPU 管理器驱动程序版本	535.54.04
客户驱动程序版本	536.25
分辨率	3840x2160
vGPU 配置文件	L40S-48Q、L40S-24Q、L40S-12Q
工作负载	Specviewperf 2020