NVIDIA Virtual PC (vPC): 容量规划指南

概述

本文档深入探讨了如何为知识工作者利用 NVIDIA Virtual PC (vPC)。它基于 NVIDIA 的 nVector 知识工作者基准测试提供建议,并涵盖常见问题,例如

  • 我的业务需求应该使用哪种 NVIDIA® GPU?

  • 我应该为我的用户类型选择哪个合适的 NVIDIA 虚拟 GPU (vGPU) 配置文件?

  • 与传统的纯 CPU 虚拟桌面基础设施 (VDI) 相比,运行 NVIDIA vPC 有哪些优势?

知识工作者的工作负载因用户而异,具体取决于许多因素,包括应用程序、应用程序类型、文件大小以及显示器数量及其分辨率。测试程序使用 NVIDIA nVector(一种用于捕获真实世界指标的工具)作为测试框架,用于执行模拟应用程序工作流的典型知识工作者工作负载。由于显示器数量及其分辨率直接影响容量规划,因此我们支持本文档的测试探索了具有各种屏幕分辨率的多显示器设置。测试在纯 CPU 虚拟机 (VM) 以及由 NVIDIA vGPU 加速的 VM 上执行。

建议您测试独特的 workloads 以确定满足您需求的最佳 NVIDIA 虚拟 GPU 解决方案。最成功的客户部署始于概念验证 (POC),并在部署的整个生命周期中进行“调整”。从 POC 开始,客户能够了解其用户的期望和行为,并优化其部署以获得最佳用户密度,同时保持所需的性能水平。持续维护至关重要,因为用户行为可能会在整个项目中发生变化,以及组织内每个人的角色。例如,曾经是轻度图形用户的用户在更换团队或被分配到不同的项目时可能会变成重度图形用户。管理和监控工具使管理员和 IT 人员能够针对每个用户优化其部署。

NVIDIA 的性能工程团队开发了一种方法和基准测试工具,可以大规模模拟知识工作者工作流程。此工作流程是常用软件应用程序的良好代表

  • Microsoft Word

  • Microsoft Excel

  • Microsoft PowerPoint

  • Google Chrome (32 位) 网络浏览器和视频流

  • PDF 文档查看

这些应用程序将在整个测试过程中执行各种功能,复制最终用户的任务。Microsoft Word、Excel 和 PowerPoint 创建新内容、修改现有内容以及在应用程序之间移动内容。这些应用程序中的任务包括滚动、缩放、菜单导航和 PDF 创建。Google Chrome 流式传输实时视频并访问交互式网站。Microsoft Edge 充当 PDF 查看器。

当大规模运行 nVector 知识工作者工作负载时,nVector 会在多个虚拟机之间随机化工作负载。

image2.png

NVIDIA Virtual PC (vPC) 软件版本支持交付由 NVIDIA GPU 加速的图形丰富的虚拟桌面。NVIDIA vPC 允许在多个虚拟机之间共享同一个 GPU,为知识工作者提供原生 PC 体验,同时提高用户密度。由于通常在 CPU 上完成的任务被卸载到 GPU,因此用户体验更好,并且可以支持更多用户。

虚拟 GPU 配置文件决定分配给虚拟机的帧缓冲区大小。NVIDIA vPC 软件在 NVIDIA GPU 上支持的 vGPU 配置文件为 1B(具有 1024 MB 帧缓冲区)和 2B(具有 2048 MB 帧缓冲区)。1B 配置文件通常支持单显示器和双 HD 配置,并在考虑密度时使用。2B 配置文件可以利用多显示器设置,通常用于更高分辨率的配置。使用 NVIDIA 的 nVector 测试框架,我们对具有这两种配置文件的各种配置进行了广泛的测试,以便让 IT 管理员了解在其自身环境中扩展时会发生什么。由于用户在应用程序中的工作负载利用率各不相同,因此建议使用您的工作负载对照本文档中完成的测试执行 POC。

image3.png

4 支持从 NVIDIA 虚拟 GPU 软件 2018 年 3 月版本(6.0 版)开始。

13 5K 分辨率支持从 NVIDIA 虚拟 GPU 软件 2019 年 12 月版本(10.0 版)开始。

NVIDIA vPC 为数字化工作场所提供引人入胜的用户体验。用户可以使用现代应用程序,并以他们想要的方式从任何地方高效工作。与纯 CPU VDI 相比,NVIDIA vPC 与 A16 结合使用可提供高达 50% 的性能提升 1,使 IT 部门能够经济高效地将虚拟化扩展到每个用户,其性能可与物理 PC 相媲美。

密度优化的 GPU 通常推荐用于运行 Office 办公应用程序、流式视频、Windows 10 和 Windows 11 的虚拟桌面用户。它们旨在最大限度地提高服务器中支持的 VDI 用户数量。

NVIDIA A16

# GPU / 板卡 [架构] 4 [Ampere]
RT 内核 40 [每 GPU 4 x 10]
内存大小 64 GB GDDR6 [每 GPU 4 x 16GB]
外形尺寸 PCIe 4.0 双插槽 FHFL
功耗 250W
散热 被动
优化用于 密度
每板卡 1B 用户 64

NVIDIA A16 基于 NVIDIA Ampere™ 架构。A16 是一款 64 GB(4 个 GPU,每卡 16 GB)双插槽 FHFL 卡,功耗高达 250 W,采用被动散热。

A16 为知识工作者部署提供了最佳价值。这使 IT 部门能够通过运行虚拟工作站、深度学习推理、渲染和其他图形和计算密集型工作负载来最大化数据中心资源——所有这些都利用相同的数据中心基础设施。这种运行混合工作负载的能力可以通过使您的数据中心昼夜不停地运行来提高用户生产力。例如,IT 部门可以在白天为知识工作者分配资源,并在晚上运行渲染和计算工作负载。这种方法最大限度地提高了利用率并降低了数据中心的成本。有关 A16 的更多信息,请查看 A16 产品功能。

注意

为了能够使用 A16 运行混合工作负载,请注意 NVIDIA Virtual GPU 软件包装、定价和许可指南 中的相应软件许可。

所有当前的 GPU 都支持 ECC 内存,并且默认情况下启用,这与禁用 ECC 时可用的 VRAM 相比,减少了可用 VRAM 的大小。物理 GPU(即未运行 vGPU)在启用 ECC 时也会看到相同的 VRAM 减少。从 Maxwell、Pascal 和 Turing GPU 切换到较新的 GPU(如 A16)时,必须调整环境大小。更多信息请参见 此处

注意

为了最大化较新 GPU(如 A16)上的可用 VRAM,请确保禁用 ECC 内存。当从 Maxwell、Pascal 和 Turing 架构过渡时,此步骤至关重要。

NVIDIA vPC VDI 每用户成本

image5.png

该图假设 GPU 的估计市场价格加上四年订阅的 NVIDIA vPC 软件成本,再除以用户数。NVIDIA 推荐 A16 用于 vPC,突出了其针对密度和每用户成本效益的优化。但是,在需要更多图形密集型任务(如光线追踪)且不注重扩展的场景中,L40 或 L4 可能更合适。配备每 GPU 142 个 RT 内核的 L40 或配备每 GPU 60 个 RT 内核的 L4 可以在这种情况下提供卓越的性能。

支持 vPC 的完整 NVIDIA GPU 列表可以在此处找到。

[1]

性能测量使用 NVIDIA nVector 基准,运行知识工作者工作负载(Excel、Word、PowerPoint、Chrome、媒体播放器、PDF),在双 1920x1080 分辨率显示器上使用 NVIDIA vPC (vGPU 13.0) 和 NVIDIA A16-1B 测量帧数/秒。

上一篇 NVIDIA Virtual PC (vPC): 容量规划指南
下一篇 测试方法
© 版权所有 © 2013-2025, NVIDIA Corporation。 上次更新时间:2025 年 1 月 13 日。