NVIDIA 文档中心 NVIDIA 虚拟 GPU (vGPU) 软件 NVIDIA RTX vWS：虚拟化工作负载的尺寸调整和 GPU 选择指南概述

概述

NVIDIA 虚拟 GPU (vGPU) 解决方案提供了一种灵活的方式来加速虚拟化环境中的工作负载。此解决方案利用 NVIDIA 图形处理单元 (GPU) 进行虚拟化，并利用 NVIDIA 软件来虚拟化这些 GPU，从而满足广泛的业务需求和工作负载。

选择合适的 GPU 硬件和虚拟 GPU 软件使客户能够受益于通过软件更新定期交付的创新功能，从而无需频繁购买硬件。这种灵活性还允许 IT 部门构建针对特定用户需求和工作负载量身定制的最佳解决方案。

一个常见的问题是：“我如何选择 NVIDIA GPU 和虚拟化软件的最佳组合，以最好地满足我的工作负载需求？” 本文档通过考虑原始性能、每美元性能 ¹ 和总体成本效益等因素，为回答这个问题提供指导。

本指南还提供了关于如何为创意和技术专业人士部署 NVIDIA® RTX™ 虚拟工作站 (RTX vWS) 软件的最佳实践。它解决了以下关键问题

哪款 NVIDIA GPU 最适合我的业务？
我如何为我的用户选择合适的 NVIDIA 虚拟 GPU (vGPU) 配置文件？
我应该如何正确调整我的虚拟工作站环境的大小？

为了确定最符合您需求的 NVIDIA 虚拟 GPU 解决方案，使用真实世界的工作负载进行测试至关重要。成功的部署通常从 POC 开始，然后进行持续监控，以确保解决不断变化的用户行为或应用程序需求。例如，轻度图形用户可能会随着任务的发展或新应用程序的引入而转变为重度图形用户。

管理和监控工具对于维护优化的部署至关重要。本文档概述了这些工具以及在 POC 期间和整个部署生命周期中要跟踪的关键资源使用指标。此外，它还涵盖了重要的注意事项，例如选择经过 NVIDIA vGPU 认证的 OEM 服务器、了解受支持的 NVIDIA GPU 以及考虑功耗和散热限制。

表 1 总结了虚拟化工作负载的 NVIDIA vGPU 解决方案。

*表 1 - 虚拟化工作负载的最佳 NVIDIA 解决方案*
工作负载	GPU 虚拟化软件	最佳原始性能 GPU	最具成本效益的 GPU
知识工作者 VDI	NVIDIA vPC	NVIDIA L4	NVIDIA A16
专业图形	NVIDIA RTX vWS	NVIDIA L40S	NVIDIA L4

云服务提供商提供有关使用 NVIDIA GPU 调整大小以优化专业可视化工作负载性能的建议。这些建议包括有关 GPU 实例配置、用例和部署指南的详细信息。查看我们的一些 CSP 以获取更多信息

什么是 NVIDIA RTX vWS？

NVIDIA RTX™ 虚拟工作站软件支持从数据中心构建强大的虚拟工作站，使专业人士可以在任何设备上从任何地方使用熟悉的工具进行工作。RTX vWS 由所有主要的公有云供应商支持，是虚拟化企业的行业标准。

NVIDIA RTX vWS 使用 NVIDIA RTX Enterprise 驱动程序、ISV 认证、NVIDIA CUDA®、OpenCL、更高分辨率的显示器和更大的 GPU 配置文件来虚拟化专业可视化应用程序。

为什么选择 NVIDIA vGPU？

NVIDIA RTX vWS 软件构建于 NVIDIA 虚拟 GPU (vGPU) 技术之上，并集成了 NVIDIA RTX Enterprise 驱动程序，这对于图形密集型应用程序至关重要。RTX vWS 使用 NVIDIA vGPU 访客驱动程序，确保高性能图形、应用程序兼容性、成本效益和可扩展性。这种灵活性允许根据 GPU 计算或内存需求不同的特定任务来定制 VM。

NVIDIA RTX 技术代表了计算机图形领域的重大飞跃，以前所未有的速度彻底改变了模拟物理世界的应用程序。借助 AI、光线追踪和模拟技术的进步，RTX 技术促进了令人惊叹的 3D 设计、照片级真实感模拟和令人叹为观止的视觉效果的快速创建。这项技术加速了实时电影质量环境的渲染，实现了精确的阴影、反射和折射，从而使艺术家和创作者能够比以往更快地制作高保真内容。

NVIDIA RTX 虚拟工作站利用了 NVIDIA RTX 技术的进步。使用 NVIDIA RTX vWS 可以访问虚拟化环境中的强大 GPU，以及 vGPU 软件功能，例如

管理和监控：使用基于虚拟机监控程序的工具简化数据中心管理。
实时迁移：无缝迁移 GPU 加速的 VM 而不会中断，从而简化维护和升级。
安全性：将服务器虚拟化的优势扩展到 GPU 工作负载，从而增强数据保护。
多租户：安全地隔离工作负载并同时支持多个用户。

在概念验证 (POC) 期间，需要考虑的事项包括选择经过 NVIDIA vGPU 认证的 OEM 服务器、验证 NVIDIA GPU 兼容性以及评估数据中心内的功耗和散热限制。

NVIDIA vGPU 是所有受支持的 GPU 板卡上的许可产品。需要软件许可证才能启用访客 VM 中的所有 vGPU 功能。所需的许可证类型取决于 vGPU 类型。

Q 系列 vGPU 类型需要 vWS 许可证。
B 系列 vGPU 类型需要 vPC 许可证，但也可以与 vWS 许可证一起使用。
A 系列 vGPU 类型需要 vApps 许可证。

注意

最终用户许可协议 (EULA) 要求每个单独的用户或会话都需要单独的许可证。遵守此要求对于确保正确使用和遵守许可条款至关重要。

NVIDIA vGPU 架构

图 1 说明了 NVIDIA 虚拟 GPU 的高级架构。NVIDIA GPU 安装在服务器内部，并附带安装在主机服务器上的 NVIDIA vGPU 管理器软件。该软件有助于在多个 VM 之间共享单个 GPU。或者，vGPU 技术允许单个 VM 利用来自一个或多个物理 GPU 的多个 vGPU。

物理 NVIDIA GPU 可以支持多个虚拟 GPU (vGPU)，这些 vGPU 直接分配给访客 VM，并由在虚拟机监控程序中运行的 NVIDIA 虚拟 GPU 管理器控制。访客 VM 与 NVIDIA vGPU 的交互方式类似于它们与虚拟机监控程序管理的直接直通物理 GPU 的交互方式。

图 1 - NVIDIA vGPU 系统架构

在 NVIDIA vGPU 部署中，根据为每个 VM 分配的 vGPU 配置文件来识别适当的 vGPU 许可证。每个 NVIDIA vGPU 的行为都类似于传统的 GPU，具有固定数量的 GPU 内存，并支持一个或多个虚拟显示输出或显示头。多个显示头可以容纳多个显示器。vGPU 内存分配由安装在虚拟机监控程序中的 NVIDIA vGPU 管理器管理，在创建时使用物理 GPU 帧缓冲区，并保持对该 GPU 内存的独占使用权，直到终止。

共享物理 GPU 的所有 vGPU 都可以访问其引擎，包括图形 (3D)、视频解码和编码引擎。为了获得最佳性能和关键路径，VM 的访客操作系统利用对 GPU 的直接访问，而非关键管理操作则利用与 NVIDIA 虚拟 GPU 管理器的半虚拟化接口。

[1]

每美元性能衡量您为成本获得的性能，计算方法是将系统的性能除以其总成本，包括硬件和软件。这有助于评估不同 vGPU 解决方案的成本效益。

上一页 NVIDIA RTX vWS：虚拟化工作负载的尺寸调整和 GPU 选择指南

下一页 NVIDIA RTX vWS 推荐的 NVIDIA GPU