开始之前
本节介绍构建概念验证 (POC)、调整您的 VDI 环境大小、一般先决条件以及部署前必须解决的一般准备步骤。
您应该测试您独特的 workloads,以确定最适合您组织需求和目标的 NVIDIA 虚拟 GPU 解决方案。最成功的客户部署始于概念验证 (POC),并在整个部署生命周期中进行“调整”。从 POC 开始,客户能够了解其用户的期望和行为,并优化其部署以获得最佳用户密度,同时保持所需的性能水平。持续监控至关重要,因为用户行为可能会在整个项目或组织内的个人变更中发生变化。曾经是轻图形用户(vApps、vPC)的用户,当他们更换团队和/或项目时,可能会通过专业可视化(RTX vWS)成为重图形用户。
在您的 POC 期间考虑以下事项
应考虑全面审查所有用户组、他们的 workloads、使用的应用程序以及当前和未来的预测
平衡用户密度与最终用户体验测量和分析的愿景
收集来自 IT 部门和最终用户关于基础设施和生产力需求的反馈
根据您的概念验证 (POC),我们建议为您尝试通过评估覆盖的每个用户组调整适当的环境大小。NVIDIA 提供了深入的大小调整指南,以帮助您优化扩展组织的 workloads。
通过运行 GPU Profiler 等工具来评估您现有的 workloads,以评估您的用户当前对计算、编码/解码和 GPU 帧缓冲区的 workload 需求。此评估将在稍后的 GPU 配置文件大小调整期间提供有价值的输入。此外,尽量确保您的 POC 尽可能地反映真实世界的部署。用户数据集大小、端点硬件和屏幕分辨率等因素可能会显着影响 GPU 内存消耗。
请参阅下面相应的大小调整指南,以构建您的 NVIDIA vGPU 环境
作为概述
根据每个最终用户的需求确定您的环境范围
为每种部署类型运行概念验证
实施 NVIDIA 推荐的大小调整方法
利用基准测试来帮助验证您的部署
利用 NVIDIA 特定的和行业范围的性能工具进行监控
确保性能和体验指标在可接受的阈值范围内
在 Ubuntu with KVM 上安装和配置 vGPU 软件需要以下元素
带有 NVIDIA 显卡的 NVIDIA 认证服务器,请参阅网页 NVIDIA vGPU 合作伙伴,以获取认证 NVIDIA 服务器的列表。还建议将此列表与 Ubuntu 硬件兼容性列表 (HCL) 进行交叉检查,以确保您的部署的整体兼容性。建议使用以下规格
vPC/vApps 的 CPU
Intel Xeon Gold 6338 @2.0 GHz 或更快
AMD EPYC 7713 @2.0 GHz 或更快
RTX vWS 的 CPU
Intel Xeon Gold 6354 @3.0 GHz 或更快
AMD EPYC 7763 @3.0 GHz 或更快
高速 RAM
快速网络,例如,NVIDIA 认证的一流 Mellanox ConnectX
具有至少 25GB 存储空间的笔记本电脑或 PC
闪存驱动器(建议 12GB 或以上)
在为您的 vGPU 部署考虑 CPU 时,NVIDIA 建议以下内容
vPC 部署应具有更高的核心数和更低的时钟速度,以优先考虑密度。
RTX vWS 部署应具有更高的时钟速度优先级核心数,以优先考虑性能。
要查找要使用的适当 vGPU 软件驱动程序版本,请参阅发行说明。
支持的 hypervisor 软件版本在此处列出。
对于支持的 Windows 和 Linux 客户机操作系统版本,请查阅我们的 Ubuntu 发行说明。
仅使用 NVIDIA vGPU 软件和您的虚拟化软件列为支持的客户机操作系统版本。要列为受支持,客户机操作系统版本必须受 NVIDIA vGPU 软件和您的虚拟化软件支持。NVIDIA 无法支持您的虚拟化软件不支持的客户机操作系统版本。
NVIDIA vGPU 软件仅支持 64 位客户机操作系统。不支持 32 位客户机操作系统。
NVIDIA vGPU 软件允许每个 VM 最多 16 个 vGPU。此功能仅限于某些 vGPU。有关详细信息,请参阅支持分配给 VM 的多个 vGPU 的 vGPU。
根据您的物理主机配置 BIOS,如下所述
UEFI 模式 - 启用
安全启动 - 禁用
SATA 模式的 AHCI - 启用
将启动优先级设置为 USB。
VT-d 或 AMD-V – 启用