开始之前
本节介绍如何构建概念验证 (POC)、调整 VDI 环境大小、一般先决条件以及部署前必须解决的一般准备步骤。
您应该测试独特的工作负载,以确定最适合您组织需求和目标的 NVIDIA 虚拟 GPU 解决方案。最成功的客户部署始于概念验证 (POC),并在整个部署生命周期中进行“调整”。从 POC 开始,客户能够了解用户的期望和行为,并优化其部署以获得最佳用户密度,同时保持所需的性能水平。持续监控至关重要,因为用户行为可能会在整个项目或组织内的个人变更中发生变化。曾经是轻图形用户(vApps、vPC)的用户,当他们更换团队和/或项目时,可能会通过专业可视化(RTX vWS)成为重图形用户。
在 POC 期间考虑以下事项
应全面审查所有用户组、其工作负载、使用的应用程序以及当前和未来的预测
平衡用户密度与最终用户体验衡量和分析的愿景
收集来自 IT 和最终用户关于基础设施和生产力需求的反馈。
根据您的概念验证 (POC),我们建议为每个您尝试通过评估覆盖的用户组调整适当的环境大小。NVIDIA 提供深入的大小调整指南,以帮助优化扩展组织工作负载的过程。
请参考以下适当的大小调整指南来构建您的 NVIDIA vGPU 环境
作为概述
根据每个最终用户的需求确定环境范围
为每种部署类型运行概念验证
实施 NVIDIA 推荐的大小调整方法
利用基准测试来帮助验证您的部署
利用 NVIDIA 特定的和行业范围的性能工具进行监控
确保性能和体验指标在可接受的阈值范围内
在部署 Azure Stack HCI 23H2 版之前,请通过以下方式确保您的硬件是最新的
确定 Solution Builder Extension (SBE) 包的当前版本。
找到下载、安装和更新 SBE 包的最佳方法。
Azure Stack HCI 硬件要求
服务器数量:支持 1 到 16 台服务器。每台服务器必须是相同的型号和制造商,具有相同的网络适配器,并具有相同数量和类型的存储驱动器。
CPU:64 位 Intel Nehalem 级或 AMD EPYC 或更高版本的兼容处理器,带有二级地址转换 (SLAT)。
内存:每个节点至少 32 GB RAM。
主机网络适配器:Windows Server 目录中列出的至少两个网络适配器。或者每个意图的专用网络适配器,这确实需要两个单独的适配器用于存储意图。有关更多信息,请参阅Windows Server 目录。
启动驱动器:最小尺寸为 200 GB。
数据驱动器:至少两个磁盘,最小容量为 500 GB(SSD 或 HDD)。单台服务器必须仅使用一种驱动器类型:非易失性内存 Express (NVMe) 或固态 (SSD) 驱动器。
可信平台模块 (TPM):TPM 2.0 版硬件必须存在并已打开。
安全启动:安全启动必须存在并已打开。
出于演示目的,本指南使用 Azure Stack HCI 23H2 版。
查看 Azure Stack HCI 的部署先决条件和系统要求。此外,查看GPU 分区功能的先决条件。
确保为您的用例使用合适的 NVIDIA GPU。参考NVIDIA 虚拟 GPU 定位指南,以更好地了解哪种 GPU 适合您的部署要求。如需更多指导,请联系您的 NVIDIA 和 Microsoft 销售代表。
Azure 要求:
Azure 订阅:您可以使用任何类型的现有订阅。
Azure 帐户:如果您还没有 Azure 帐户,请先创建一个帐户。
Azure Stack HCI 上的 GPU 分区支持以下 Guest 操作系统
Windows 10 或更高版本
Windows 10 企业版多会话或更高版本
Windows Server 2019 或更高版本
Linux Ubuntu 20.04 LTS、Linux Ubuntu 22.04 LTS
Red Hat Enterprise Linux 9.4、8.9.0 和 7.9.0
以下 GPU 支持 GPU 分区
NVIDIA A2
NVIDIA A10
NVIDIA A16
NVIDIA A40
NVIDIA L4
NVIDIA L40
NVIDIA L40S
如果您的配置不是同构的(意味着所有 GPU 必须是相同的类型),则不支持 GPU 分区。您不能将物理 GPU 同时分配为离散设备分配 (DDA)或可分区 GPU。
请咨询您的 OEM,了解 Azure Stack HCI 23H2 版所需的通用 BIOS 设置。这些设置可能包括硬件虚拟化、TPM 已启用和安全核心。
配置 BIOS 以启用 Intel VT 或 AMD-V。