VMware vCenter GPU 管理器用户指南
NVIDIA GPU Manager for VMware vCenter 使您能够从 VMware vCenter Server 的 vSphere Client 管理 NVIDIA GPU。
安装和配置 NVIDIA GPU Manager for VMware vCenter 后,您可以使用与 vSphere Web Client 用户界面集成的基于 Web 的工具下载并安装 NVIDIA GPU 驱动程序,而无需在 hypervisor 上运行一组命令。NVIDIA GPU Manager for VMware vCenter 通过提供额外的特性和功能来管理 VMware vCenter 集群、VMware vSphere Hypervisor (ESXi) 主机和访客 VM 的 NVIDIA GPU,从而扩展了 VMware vCenter Server 的功能。NVIDIA GPU Manager for VMware vCenter 由一个虚拟设备和一个 vSphere Client 插件组成。
- 适用于 VMware vCenter 虚拟设备的 NVIDIA GPU Manager 包含以下组件
- NVIDIA GPU Manager 应用程序,用于注册 NVIDIA GPU Manager for VMware vCenter
- NVIDIA GPU Manager 驱动程序存储库,用于存储下载的驱动程序
- 基于 Web 的管理界面,用于访问设备上的 NVIDIA GPU Manager 应用程序
- vSphere Client 插件 包含用户界面资源,这些资源在注册 NVIDIA GPU Manager for VMware vCenter 时从虚拟设备复制。这些资源在注册后部署在 vSphere Client 上。
为了简化 NVIDIA GPU Manager for VMware vCenter 的安装和管理,它作为虚拟设备映像分发,以便安装在受支持的 VMware vSphere 版本上。此设备是一个安全、强化的环境,其中对应用软件的访问受到严格控制。
每个 NVIDIA GPU Manager for VMware vCenter 设备都配置有一个用户帐户。您无法修改此用户帐户或向设备添加其他用户帐户。
2.1. NVIDIA GPU Manager for VMware vCenter 虚拟设备的平台要求
继续之前,请确保您拥有适合托管 NVIDIA GPU Manager for VMware vCenter 虚拟设备的平台。
- 托管平台必须是运行受支持的 VMware vSphere 版本的物理主机。
- VM 中运行 NVIDIA GPU Manager for VMware vCenter 虚拟设备的最低资源要求如下
- vCPU 数量 2
- RAM: 4 GB
- 磁盘大小: 35 GB
- 平台必须具有固定的(不变的)IP 地址。IP 地址可以通过 DHCP 动态分配或静态配置,但必须是恒定的。
- 平台的日期和时间必须准确设置。建议使用 NTP。有关如何在 ESXi 主机上配置 NTP 的信息,请参阅VMware 知识库文章:使用 vSphere Client (57147) 在 ESXi 主机上配置网络时间协议 (NTP)。
在继续安装之前,请参阅GPU Manager for VMware vCenter 发行说明,了解有关受支持的 VMware vSphere 版本、Web 浏览器和已知问题的详细信息。
2.2. NVIDIA GPU Manager for VMware vCenter 虚拟设备的主机名解析要求
托管 NVIDIA GPU Manager for VMware vCenter 虚拟设备的平台必须通过其 IP 地址或其完全限定域名来标识。如果要通过其完全限定域名来标识平台,请确保在安装虚拟设备之前设置所需的 DNS 条目。如果要通过其默认主机名来标识平台,则必须设置一个 DNS 条目,将默认主机名映射到完全限定域名。
设置这些 DNS 条目的过程与安装虚拟设备的过程是分开的。使用您正在使用的名称解析服务的标准接口来设置所需的 DNS 条目。
对于域名和 IP 地址之间的每个映射,请确保同时设置正向指针和反向指针 DNS 条目。
对于 Windows DNS 服务器上的反向指针 DNS 条目,完全限定域名请使用全部小写字母。
要确定正向指针和反向指针 DNS 条目是否已正确设置,请在与 NVIDIA GPU Manager for VMware vCenter 虚拟设备位于同一网络上的任何主机上的命令或 shell 窗口中键入以下命令
-
对于正向指针条目,键入
$ nslookup domain-name
- 域名
- 您要确定其正向指针 DNS 条目是否正确的域名。
如果 DNS 条目已正确设置,则该命令将显示映射到域名的 IP 地址。
-
对于反向指针条目,键入
$ nslookup ip-address
- IP 地址
- 您要确定其反向指针 DNS 条目是否正确的 IP 地址。
如果 DNS 条目已正确设置,则该命令将显示映射到 IP 地址的域名。
2.3. NVIDIA GPU Manager for VMware vCenter 的防火墙规则
要通过防火墙启用通信,必须定义允许特定 URL 上流量的防火墙规则。要设置这些规则,请使用您正在使用的防火墙的标准接口,例如 Zscaler Firewall。
要启用 NVIDIA GPU Manager for VMware vCenter 与 NVIDIA 许可门户之间通过防火墙的通信,必须定义允许下表 URL 上流量的防火墙规则。
URL | 流量 |
---|---|
api.licensing.nvidia.com |
来自 NVIDIA 许可门户的 NVIDIA vGPU 软件图形驱动程序元数据 |
griddownloads.nvidia.com |
来自 NVIDIA 许可门户的 NVIDIA vGPU 软件图形驱动程序二进制文件 |
2.4. 安装 NVIDIA GPU Manager for VMware vCenter 虚拟设备
NVIDIA GPU Manager for VMware vCenter 映像以 ZIP 存档形式分发,其中包含开放虚拟设备 (OVA) 文件。您可以使用 VMware vSphere 的标准接口来安装虚拟设备。
虚拟设备映像指定了 VM 的最低配置,如NVIDIA GPU Manager for VMware vCenter 虚拟设备的平台要求中所列。安装虚拟设备时,您无需指定 VM 配置。安装 NVIDIA GPU Manager for VMware vCenter 虚拟设备后,如果需要,可以使用 hypervisor 的标准接口来更改 VM 的配置。
使用 VMware vSphere Client 在您要运行 NVIDIA GPU Manager for VMware vCenter 虚拟设备的 ESXi 服务器上执行此任务。有关更多信息,请参阅 VMware 文档站点上的以下主题
- 下载包含包含 NVIDIA GPU Manager for VMware vCenter 映像的 OVA 文件的 ZIP 存档。
- 解压您下载的 ZIP 存档的内容。
- 使用 VMware vSphere Client 登录到 vCenter Server。
- 从 VMware vSphere Client操作菜单中,选择部署 OVF 模板。
- 选择本地文件选项,浏览并选择下载的 OVA 文件,然后单击下一步。
- 输入您选择的虚拟机名称,选择虚拟机的位置,然后单击下一步。
- 选择将在其中创建虚拟机的计算资源,然后单击下一步。
- 查看您要部署的模板的详细信息,然后单击下一步。
- 接受 NVIDIA 软件许可协议,然后单击下一步。
- 选择虚拟设备配置和磁盘文件的存储,然后单击下一步。
- 将网络属性留空以从 DHCP 服务器获取网络设置,或者提供静态 IP 地址的网络设置,然后单击下一步。注意
您可以在安装虚拟设备后更改这些设置,如更新 NVIDIA GPU Manager for VMware vCenter 虚拟设备的网络设置中所述。
按如下方式提供静态 IP 地址的网络设置。
- 在IPv4 地址文本输入字段中,键入您要分配给虚拟设备的 IP 地址。此地址必须是 VM 虚拟网络子网范围内的未使用 IP 地址。
- 在网络掩码前缀文本输入字段中,以无类别域间路由 (CIDR) 格式键入虚拟设备网络的子网掩码,不带前导斜杠字符 (/)。要从十进制等效值获取 CIDR 格式的子网掩码,请参阅IETF RFC 1878:IPv4 的可变长度子网表第 2 页上的表格。例如,十进制等效值 255.255.255.0 的 CIDR 格式的子网掩码为 24。
- 在网关文本输入字段中,键入虚拟设备默认网关的 IP 地址。
- 在DNS 服务器 1 文本输入字段中,键入要用于名称解析的第一个 DNS 服务器的 IP 地址。
- 可选:在DNS 服务器 2 文本输入字段中,键入要用于名称解析的第二个 DNS 服务器的 IP 地址。
注意如果任何字段(除了DNS 服务器 2)为空或任何字段包含无效数据,则不会为 VM 分配静态 IP 地址。相反,VM 会从 DHCP 服务器获取网络设置。
- 查看您要创建的虚拟机的全部详细信息,然后单击完成。
- 启动您创建的 VM。
2.5. 注册 NVIDIA GPU Manager for VMware vCenter 管理员用户
每个 NVIDIA GPU Manager for VMware vCenter 虚拟设备都配置了一个专门用于管理 NVIDIA GPU Manager for VMware vCenter 的用户帐户。此帐户通过基于 Web 的管理界面提供对设备上 NVIDIA GPU Manager 应用程序的访问。在管理 NVIDIA GPU Manager for VMware vCenter 虚拟设备之前,您必须注册此用户才能访问此管理界面。
- 打开 Web 浏览器并连接到 URL
https://<i>vcenter-gpu-mgr-vm-ip-address</i>
。- vcenter-gpu-mgr-vm-ip-address
- 安装 NVIDIA GPU Manager for VMware vCenter 虚拟设备的 VM 的 IP 地址,如果已定义,则为完全限定域名。
您可以从 hypervisor 的管理控制台获取 IP 地址。
- 在打开的“注册用户帐户”页面上,提供并确认 NVIDIA GPU Manager for VMware vCenter 管理员用户 vcp_admin 的密码。注意
如果 NVIDIA GPU Manager for VMware vCenter 管理员用户已注册,则会打开登录页面而不是“注册用户帐户”页面。
密码长度必须至少为八个字符,并且必须包含至少一个大写字母、一个小写字母、一个数字以及以下特殊字符之一:~、#、?、!、@、$、%、^、&、*、-、+、= 和 _ 。
注意您可以在注册 NVIDIA GPU Manager for VMware vCenter 管理员用户后的任何时间更改其密码。有关说明,请参阅更改 NVIDIA GPU Manager for VMware vCenter 管理员密码。
- 单击注册。“注册用户帐户”页面将刷新以确认用户已注册,并显示本地重置密钥,使您能够重置用户的密码。
- 复制本地重置密钥并安全地存储它,例如,通过单击剪贴板图标并将本地重置密钥粘贴到只有您可以读取的纯文本文件中。注意
您将需要此密钥来重置忘记的 NVIDIA GPU Manager for VMware vCenter 管理员用户的密码。如果您丢失此密钥,您将无法重置忘记的 NVIDIA GPU Manager for VMware vCenter 管理员用户的密码。
- 单击继续登录。
- 在打开的登录页面上,提供您为 vcp_admin 用户设置的密码,然后单击登录。
2.6. 更改 NVIDIA GPU Manager for VMware vCenter 管理员密码
为了增强安全性,请在注册 NVIDIA GPU Manager for VMware vCenter 管理员用户后定期更改其密码。
- 打开 Web 浏览器并连接到 URL
https://<i>vcenter-gpu-mgr-vm-ip-address</i>
。- vcenter-gpu-mgr-vm-ip-address
- 安装 NVIDIA GPU Manager for VMware vCenter 虚拟设备的 VM 的 IP 地址,如果已定义,则为完全限定域名。
您可以从 hypervisor 的管理控制台获取 IP 地址。
- 在打开的登录页面上,提供 NVIDIA GPU Manager for VMware vCenter 虚拟设备上 NVIDIA GPU Manager for VMware vCenter 管理员用户的用户凭据,然后单击登录。
- 在打开的 NVIDIA GPU Manager for VMware vCenter 设备上的 NVIDIA GPU Manager 应用程序页面的右上角,单击更改密码。
- 在打开的“更改密码”页面上,输入当前密码,提供新密码,然后确认 NVIDIA GPU Manager for VMware vCenter 管理员用户的新密码。
- 在当前密码文本输入字段中,键入 NVIDIA GPU Manager for VMware vCenter 管理员用户的当前密码。
- 在新密码文本输入字段中,键入您要为 NVIDIA GPU Manager for VMware vCenter 管理员用户设置的新密码。
密码长度必须至少为八个字符,并且必须包含至少一个大写字母、一个小写字母、一个数字以及以下特殊字符之一:~、#、?、!、@、$、%、^、&、*、-、+、= 和 _ 。
- 在确认新密码文本输入字段中,键入您在新密码文本输入字段中键入的密码。
- 单击更改密码。
2.7. 重置忘记的 NVIDIA GPU Manager for VMware vCenter 管理员密码
如果您忘记了 NVIDIA GPU Manager for VMware vCenter 管理员密码,可以使用其本地重置密钥来重置密码。
- 打开 Web 浏览器并连接到 URL
https://<i>vcenter-gpu-mgr-vm-ip-address</i>
。- vcenter-gpu-mgr-vm-ip-address
- 安装 NVIDIA GPU Manager for VMware vCenter 虚拟设备的 VM 的 IP 地址,如果已定义,则为完全限定域名。
您可以从 hypervisor 的管理控制台获取 IP 地址。
- 在打开的登录页面上,单击忘记密码?链接。
- 在打开的“重置密码”窗口中,输入本地重置密钥,提供新密码,然后确认 NVIDIA GPU Manager for VMware vCenter 管理员用户的新密码。
- 在本地重置密钥文本输入字段中,键入在注册 NVIDIA GPU Manager for VMware vCenter 管理员用户时创建的本地重置密钥。
- 在密码文本输入字段中,键入您要为 NVIDIA GPU Manager for VMware vCenter 管理员用户设置的新密码。
密码长度必须至少为八个字符,并且必须包含至少一个大写字母、一个小写字母、一个数字以及以下特殊字符之一:~、#、?、!、@、$、%、^、&、*、-、+、= 和 _ 。
- 在确认密码文本输入字段中,键入您在密码文本输入字段中键入的密码。
- 单击重置密码。
2.8. 登录到 NVIDIA GPU Manager for VMware vCenter 虚拟设备
每个 NVIDIA GPU Manager for VMware vCenter 虚拟设备都配置了一个专门用于管理 NVIDIA GPU Manager for VMware vCenter 的用户帐户。此帐户通过基于 Web 的管理界面提供对设备上 NVIDIA GPU Manager 应用程序的访问。
确保已为设备注册 NVIDIA GPU Manager for VMware vCenter 管理员用户,如注册 NVIDIA GPU Manager for VMware vCenter 管理员用户中所述。
- 打开 Web 浏览器并连接到 URL
https://<i>vcenter-gpu-mgr-vm-ip-address</i>
。- vcenter-gpu-mgr-vm-ip-address
- 安装 NVIDIA GPU Manager for VMware vCenter 虚拟设备的 VM 的 IP 地址,如果已定义,则为完全限定域名。
您可以从 hypervisor 的管理控制台获取 IP 地址。
- 在打开的登录页面上,提供 NVIDIA GPU Manager for VMware vCenter 虚拟设备上 NVIDIA GPU Manager for VMware vCenter 管理员用户的用户凭据,然后单击登录。
2.9. 使用第三方签名 SSL 证书配置 NVIDIA GPU Manager for VMware vCenter 虚拟设备
默认情况下,NVIDIA GPU Manager for VMware vCenter 虚拟设备配置了在虚拟设备启动时生成的自签名 SSL 证书。如有必要,您可以使用第三方(例如证书颁发机构 (CA))签名的 SSL 证书替换自签名证书。
当 NVIDIA GPU Manager 在 VMware vCenter Server 中注册时,配置虚拟设备的 SSL 证书会导入到 VMware vCenter Server 中。因此,请尝试在 VMware vCenter Server 中注册 NVIDIA GPU Manager 之前,使用新的 SSL 证书配置虚拟设备。
否则,您必须确认可以使用 vSphere Lifecycle Management (vLCM) 在注册 NVIDIA GPU Manager 的所有 VMware vCenter Server 实例上同步新的 SSL 证书。需要此确认,因为 VMware vCenter Server 必须能够信任新证书,然后才能允许任何通过证书进行身份验证的通信。
要使用第三方签名 SSL 证书配置 NVIDIA GPU Manager for VMware vCenter 虚拟设备,请按照以下说明顺序操作
- 获取 NVIDIA GPU Manager for VMware vCenter 虚拟设备的第三方签名 SSL 证书
- 在 NVIDIA GPU Manager for VMware vCenter 虚拟设备上安装第三方签名 SSL 证书
2.9.1. 获取 NVIDIA GPU Manager for VMware vCenter 虚拟设备的第三方签名 SSL 证书
通过向合适的第三方(例如证书颁发机构 (CA))提交证书签名请求 (CSR) 来获取第三方签名 SSL 证书。
对于您需要的每个证书,请向 CA 提交证书签名请求 (CSR)。确保您请求的每个证书都满足以下要求
- 证书必须是 PEM 文本文件(不是 Java 密钥库格式),并使用私钥保护。
- 证书和私钥必须在单独的文件中。
- 为了确保 Web 浏览器信任域,域名必须是主题备用名称 (SAN) 属性的一部分,而不是 CSR 的公用名 (CN) 属性。
- CSR 的 SAN 属性必须指定将使用证书配置的任何 NVIDIA GPU Manager for VMware vCenter 虚拟设备的完全限定域名。
如果未为 NVIDIA GPU Manager for VMware vCenter 分配完全限定域名,请在其 CSR 中将 IP 地址指定为 DNS。
- 证书必须使用至少 2048 位长的 RSA、DSA 和 DH 密钥。
如有必要,请联系将提供您的证书的 CA,以获取有关如何请求满足这些要求的证书或转换现有证书以满足这些要求的信息。
2.9.2. 在 NVIDIA GPU Manager for VMware vCenter 虚拟设备上安装第三方签名 SSL 证书
确保您已获得要安装的 SSL 证书及其私钥文件。
- 登录到您要在其上安装 SSL 证书的 NVIDIA GPU Manager for VMware vCenter 虚拟设备。
- 在左侧导航窗格中,单击设置。
- 在打开的“设置”页面上,在SSL 配置部分中,单击更新。
- 在打开的更新 SSL 配置窗口中,指定您要安装的 SSL 证书及其私钥文件。
- 单击证书旁边的选择文件,然后在打开的文件浏览器中,导航到包含 SSL 证书的文件夹并选择该文件。
- 单击私钥旁边的选择文件,然后在打开的文件浏览器中,导航到包含 SSL 证书私钥的文件夹并选择该文件。
- 单击更新。
NVIDIA GPU Manager 尝试将新证书导入到已注册 NVIDIA GPU Manager 的任何 VMware vCenter Server 实例中。确认 NVIDIA GPU Manager for VMware vCenter 虚拟设备已配置 SSL 证书。
- 从 vSphere Client 菜单中,选择Lifecycle Manager,单击设置选项卡,选择管理 > 补丁设置,并确认下载源设置正确。
- 确认 vSphere Lifecycle Management (vLCM) 中的同步更新操作成功。
2.10. 更新 NVIDIA GPU Manager for VMware vCenter 虚拟设备的网络设置
如有必要,您可以在安装 NVIDIA GPU Manager for VMware vCenter 虚拟设备后的任何时间更改其网络设置。
尝试在 VMware vCenter Server 中注册 NVIDIA GPU Manager 之前更新虚拟设备的网络设置。
否则,您必须确认所有已注册 NVIDIA GPU Manager 的 VMware vCenter Server 实例都反映了更新后的网络设置。需要此确认,因为 VMware vCenter Server 上的 NVIDIA GPU Manager 插件和驱动程序存储库已链接到 NVIDIA GPU Manager for VMware vCenter 虚拟设备的 IP 地址或完全限定域名。
- 登录到您要更新网络设置的 NVIDIA GPU Manager for VMware vCenter 虚拟设备。
- 在左侧导航窗格中,单击设置。
- 在打开的“设置”页面上,在网络设置部分中,单击更新。
- 在打开的更新网络设置窗口中,选择 DHCP 以从 DHCP 服务器获取网络设置,或者提供静态 IP 地址的网络设置。按如下方式提供静态 IP 地址的网络设置。
- 确保已选择静态选项。
- 在IP 地址文本输入字段中,键入您要分配给虚拟设备的 IP 地址。此地址必须是 VM 虚拟网络子网范围内的未使用 IP 地址。
- 在网络掩码前缀文本输入字段中,以无类别域间路由 (CIDR) 格式键入虚拟设备网络的子网掩码,不带前导斜杠字符 (/)。要从十进制等效值获取 CIDR 格式的子网掩码,请参阅IETF RFC 1878:IPv4 的可变长度子网表第 2 页上的表格。例如,十进制等效值 255.255.255.0 的 CIDR 格式的子网掩码为 24。
- 在网关文本输入字段中,键入虚拟设备默认网关的 IP 地址。
- 可选:在DNS 服务器 1 文本输入字段中,键入要用于名称解析的第一个 DNS 服务器的 IP 地址。
- 可选:在DNS 服务器 2 文本输入字段中,键入要用于名称解析的第二个 DNS 服务器的 IP 地址。
- 单击更新。更新完成后,您的浏览器将与实例断开连接。
- 通过连接到 URL
https://<i>vcenter-gpu-mgr-vm-static-ip-address</i>
再次登录到 NVIDIA GPU Manager for VMware vCenter 虚拟设备。- vcenter-gpu-mgr-vm-static-ip-address
- 您为 NVIDIA GPU Manager for VMware vCenter 虚拟设备设置的静态 IP 地址。
确认网络设置已按要求更新。
- 确认 vSphere Client 显示 NVIDIA GPU Manager for VMware vCenter 的正确 IP 地址或完全限定域名。
- 确认 vSphere Lifecycle Management (vLCM) 中的同步更新操作成功。
2.11. 从 vCenter Web 控制台访问 NVIDIA GPU Manager for VMware vCenter 虚拟设备
如果 NVIDIA GPU Manager for VMware vCenter 虚拟设备网络配置不正确,您可能无法访问设备上 NVIDIA GPU Manager 应用程序的基于 Web 的管理界面。在这种情况下,您可以通过 vCenter Web Client 的 Web 控制台选项重新配置网络设置并下载日志文件以进行故障排除。虚拟设备为此目的配置了一个用户帐户。此用户帐户仅有权访问重新配置网络设置和下载日志文件所需的目录和脚本。
2.11.1. 从 Hypervisor 下载 NVIDIA GPU Manager for VMware vCenter 虚拟设备的日志文件
确保安全外壳 (SSH) 服务正在运行,并且端口 22 在您要将日志文件下载到的远程主机上打开。
- 使用 vCenter Web Client 的 Web 控制台选项,以用户 vcp_cli_user 身份登录到托管 NVIDIA GPU Manager for VMware vCenter 虚拟设备的 VM。首次以 vcp_cli_user 身份登录时,系统会提示您为此用户设置密码。
- 使用 sudo 用户权限运行 generate-log-bundle.sh 脚本。
$ sudo ./generate-log-bundle.sh
- 出现提示时,输入您要将上一步中创建的 log_bundle.zip 文件传输到的远程主机的详细信息。
- 输入将登录到远程主机的用户的用户名,例如,vcp_root。
- 输入远程主机的 IP 地址。注意
IP 地址必须是 IPv4 地址。不支持 IPv6 地址。
- 输入远程主机上您要将 log_bundle.zip 文件复制到的目录的完整路径,例如,/home/vcp_root。
- 输入您先前指定的将登录到远程主机的用户的密码。
2.11.2. 从 Hypervisor 使用 DHCP 分配 NVIDIA GPU Manager for VMware vCenter 虚拟设备的 IP 地址
- 使用 vCenter Web Client 的 Web 控制台选项,以用户 vcp_cli_user 身份登录到托管 NVIDIA GPU Manager for VMware vCenter 虚拟设备的 VM。首次以 vcp_cli_user 身份登录时,系统会提示您为此用户设置密码。
- 使用 sudo 用户权限运行 set-dhcp-cli.sh 脚本。
$ sudo ./set-dhcp-cli.sh
确认网络设置已按要求更新。
- 确认 vSphere Client 显示 NVIDIA GPU Manager for VMware vCenter 的正确 IP 地址或完全限定域名。
- 确认 vSphere Lifecycle Management (vLCM) 中的同步更新操作成功。
2.11.3. 从 Hypervisor 设置 NVIDIA GPU Manager for VMware vCenter 虚拟设备的 IP 地址
- 使用 vCenter Web Client 的 Web 控制台选项,以用户 vcp_cli_user 身份登录到托管 NVIDIA GPU Manager for VMware vCenter 虚拟设备的 VM。首次以 vcp_cli_user 身份登录时,系统会提示您为此用户设置密码。
- 使用 sudo 用户权限运行 set-static-ip-cli.sh 脚本。
$ sudo ./set-static-ip-cli.sh
- 出现提示时,输入 IP 地址的详细信息。注意
您输入的所有 IP 地址都必须是 IPv4 地址。不支持 IPv6 地址。
- 输入您要分配给 NVIDIA GPU Manager for VMware vCenter 虚拟设备的 IP 地址。
- 输入 NVIDIA GPU Manager for VMware vCenter 虚拟设备默认网关的 IP 地址。
- 输入要用于名称解析的第一个 DNS 服务器的 IP 地址。
- 输入要用于名称解析的第二个 DNS 服务器的 IP 地址。
- 以无类别域间路由 (CIDR) 格式键入 NVIDIA GPU Manager for VMware vCenter 虚拟设备网络的子网掩码,不带前导斜杠字符 (/)。要从十进制等效值获取 CIDR 格式的子网掩码,请参阅IETF RFC 1878:IPv4 的可变长度子网表第 2 页上的表格。例如,十进制等效值 255.255.255.0 的 CIDR 格式的子网掩码为 24。
确认网络设置已按要求更新。
- 确认 vSphere Client 显示 NVIDIA GPU Manager for VMware vCenter 的正确 IP 地址或完全限定域名。
- 确认 vSphere Lifecycle Management (vLCM) 中的同步更新操作成功。
2.11.4. 设置 NVIDIA GPU Manager for VMware vCenter 虚拟设备的主机名
- 使用 vCenter Web Client 的 Web 控制台选项,以用户 vcp_cli_user 身份登录到托管 NVIDIA GPU Manager for VMware vCenter 虚拟设备的 VM。首次以 vcp_cli_user 身份登录时,系统会提示您为此用户设置密码。
- 以 sudo 用户权限运行 set-hostname-cli.sh 脚本。
$ sudo ./set-hostname-cli.sh
- 出现提示时,输入您为虚拟设备选择的新主机名。
2.11.5. 自 1.2.0 版本起:重置 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器上的 SSL 证书
- 使用 vCenter Web Client 的 Web 控制台选项,以用户 vcp_cli_user 身份登录到托管 NVIDIA GPU Manager for VMware vCenter 虚拟设备的 VM。首次以 vcp_cli_user 身份登录时,系统会提示您为此用户设置密码。
- 以 sudo 用户权限运行 reset-ssl-cert.sh 脚本。
$ sudo ./reset-ssl-cert.sh
确认 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器已配置 SSL 证书。
- 从 vSphere Client 菜单中,选择Lifecycle Manager,单击设置选项卡,选择管理 > 补丁设置,并确认下载源设置正确。
- 确认 vSphere Lifecycle Management (vLCM) 中的同步更新操作成功。
2.12. 自 1.2.0 版本起:配置带有代理服务器的 VMware vCenter 的 NVIDIA GPU 管理器
VMware vCenter 的 NVIDIA GPU 管理器支持通过 Squid 代理服务器与 NVIDIA 许可门户和 vCenter Server 实例等实体进行通信。
VMware vCenter 的 NVIDIA GPU 管理器支持透明代理服务器和非透明代理服务器。
- 透明代理服务器向服务器标识自身,并且不修改客户端请求和响应。
- 非透明代理服务器不透露客户端的 IP 地址,并修改客户端请求和响应。
支持经过身份验证和未经身份验证的代理服务器。对于经过身份验证的代理服务器,支持以下身份验证方法
- 基本
- Kerberos
自 1.5.0 版本起:您可以指定要绕过已配置代理服务器的主机,并禁用和启用已配置的代理服务器。
2.12.1. 验证代理服务器的正确运行
在配置带有代理服务器的 VMware vCenter 的 NVIDIA GPU 管理器之前,请确保代理服务器可访问,代理服务器侦听客户端请求的端口已打开,并且代理服务正在其上运行。
- 使用 vCenter Web Client 的 Web 控制台选项,以用户 vcp_cli_user 身份登录到托管 NVIDIA GPU Manager for VMware vCenter 虚拟设备的 VM。首次以 vcp_cli_user 身份登录时,系统会提示您为此用户设置密码。
- 使用 netcat (nc) 命令扫描代理服务器侦听客户端请求的端口,采用详细模式,连接超时时间为 10 秒。
$ nc -zvw10 proxy-server-address port
- proxy-server-address
- 代理服务器的完全限定域名或 IP 地址。
- port
- 代理服务器侦听客户端请求的端口。
2.12.2. 自 1.5.0 版本起,可选:指定要绕过已配置代理服务器的主机
如果配置了代理服务器,则默认情况下,与 VMware vCenter 设备的 NVIDIA GPU 管理器的所有网络通信都将通过代理服务器路由。但是,您的网络部署可能需要与某些主机的通信绕过代理服务器。例如,可能仅需要代理服务器用于与公共 Internet 上的外部主机的通信,并且对于与公司内部网内的主机的通信必须绕过代理服务器。
创建一个纯文本文件,其中包含以逗号分隔的条目列表,其中每个条目定义单个主机或一组相关主机。每个条目必须采用以下格式之一
- 单个主机的完整 IPv4 地址,例如,
192.0.2.89
- 使用通配符
*
替换 IPv4 地址末尾字段中的十进制数字指定的 IPv4 地址范围,例如,192.0.2.*
或192.0.*.*
- 单个主机的完全限定域名,例如,
temp.develop.example.com
- 同一子域内的一组主机,通过在完全限定域名的开头使用通配符
*
指定,例如,*.develop.example.com
- 子网掩码以无类别域间路由 (CIDR) 格式表示的 IPv4 子网,例如,
192.0.2.0/24
注意子网中不允许使用通配符。
要从十进制等效项获取 CIDR 格式的子网掩码,请参阅 IETF RFC 1878:IPv4 可变长度子网表第 2 页上的表格。
例如,十进制等效项 255.255.255.0 的 CIDR 格式子网掩码为 24。
此文件中的条目不区分大小写。
此文件必须满足以下要求
- 文件大小不得超过 5 KB。
- 文件不得为空。
此示例指定,对于与 IPv4 地址为 192.0.2.89
和 192.0.3.101
的主机以及 develop.example.com
子域中的所有主机的通信,将绕过已配置的代理服务器。
192.0.2.89, 192.0.3.101, *.develop.example.com
创建文件后,当您配置带有代理服务器的 VMware vCenter 的 NVIDIA GPU 管理器时,将其上传到 NVIDIA GPU 管理器。有关更多信息,请参阅以下主题
- 配置带有未经身份验证的代理服务器的 VMware vCenter 的 NVIDIA GPU 管理器
- 配置带有基本身份验证代理服务器的 VMware vCenter 的 NVIDIA GPU 管理器
- 配置带有 Kerberos 身份验证代理服务器的 VMware vCenter 的 NVIDIA GPU 管理器
如果删除了代理服务器设置,则任何已上传的文件都将从 VMware vCenter 的 NVIDIA GPU 管理器中删除。
2.12.3. 配置带有未经身份验证的代理服务器的 VMware vCenter 的 NVIDIA GPU 管理器
确保您已验证代理服务器的正确运行,如验证代理服务器的正确运行中所述。
自 1.5.0 版本起,可选:如果您需要与某些主机的网络通信绕过代理服务器,请确保您已创建一个纯文本文件,其中指定了这些主机,如自 1.5.0 版本起,可选:指定要绕过已配置代理服务器的主机中所述。
- 登录到您要为其配置代理服务器的 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器。
- 在左侧导航窗格中,单击设置。
- 在打开的“设置”页面上,在“代理服务器设置”部分中,单击“更新”。
- 在打开的“代理服务器设置”窗口的“服务器”部分中,提供代理服务器的详细信息。
- 指定代理服务器的完全限定域名或 IP 地址,以及代理服务器侦听客户端请求的端口。
- 选择“无身份验证”身份验证类型。
- 自 1.5.0 版本起:如果您需要与某些主机的网络通信绕过代理服务器,请上传纯文本文件,其中指定了这些主机。
- 在“代理服务器设置”窗口的“例外”部分中,单击“选择文件”。
- 在打开的文件浏览器中,导航到包含指定这些主机的文本文件的文件夹,然后选择该文件。
注意- 如果之前已上传文件,则将被覆盖。
- 如果您在上传文件后更改了其他代理服务器设置,但未上传新文件,则现有文件将保留。
- 自 1.5.0 版本起:如果您想配置代理服务器而不测试通过代理服务器的连接,请取消选中“测试通过代理服务器的连接”选项。默认情况下,此选项处于选中状态。选中此选项后,VMware vCenter 的 NVIDIA GPU 管理器将通过代理服务器连接回自身来验证代理服务器设置。如果您的网络部署不允许循环连接,您可以取消选中“测试通过代理服务器的连接”选项以省略验证步骤。
- 单击更新。
VMware vCenter 的 NVIDIA GPU 管理器验证代理服务器的正确运行并对其进行配置。“事件”页面上会显示代理服务器已配置的确认信息。
2.12.4. 配置带有基本身份验证代理服务器的 VMware vCenter 的 NVIDIA GPU 管理器
确保您已验证代理服务器的正确运行,如验证代理服务器的正确运行中所述。
自 1.5.0 版本起,可选:如果您需要与某些主机的网络通信绕过代理服务器,请确保您已创建一个纯文本文件,其中指定了这些主机,如自 1.5.0 版本起,可选:指定要绕过已配置代理服务器的主机中所述。
- 登录到您要为其配置代理服务器的 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器。
- 在左侧导航窗格中,单击设置。
- 在打开的“设置”页面上,在“代理服务器设置”部分中,单击“更新”。
- 在打开的“代理服务器设置”窗口的“服务器”部分中,提供代理服务器的详细信息。
- 指定代理服务器的完全限定域名或 IP 地址,以及代理服务器侦听客户端请求的端口。
- 选择“基本”身份验证类型。
- 提供用户名和密码,用于验证对代理服务器的访问权限以使用代理。
- 自 1.5.0 版本起:如果您需要与某些主机的网络通信绕过代理服务器,请上传纯文本文件,其中指定了这些主机。
- 在“代理服务器设置”窗口的“例外”部分中,单击“选择文件”。
- 在打开的文件浏览器中,导航到包含指定这些主机的文本文件的文件夹,然后选择该文件。
注意- 如果之前已上传文件,则将被覆盖。
- 如果您在上传文件后更改了其他代理服务器设置,但未上传新文件,则现有文件将保留。
- 自 1.5.0 版本起:如果您想配置代理服务器而不测试通过代理服务器的连接,请取消选中“测试通过代理服务器的连接”选项。默认情况下,此选项处于选中状态。选中此选项后,VMware vCenter 的 NVIDIA GPU 管理器将通过代理服务器连接回自身来验证代理服务器设置。如果您的网络部署不允许循环连接,您可以取消选中“测试通过代理服务器的连接”选项以省略验证步骤。
- 单击更新。
VMware vCenter 的 NVIDIA GPU 管理器验证代理服务器的正确运行,验证用于验证对代理服务器的访问权限的凭据以使用代理,并配置代理服务器。“事件”页面上会显示代理服务器已配置的确认信息。
2.12.5. 配置带有 Kerberos 身份验证代理服务器的 VMware vCenter 的 NVIDIA GPU 管理器
确保您已验证代理服务器的正确运行,如验证代理服务器的正确运行中所述。
自 1.5.0 版本起,可选:如果您需要与某些主机的网络通信绕过代理服务器,请确保您已创建一个纯文本文件,其中指定了这些主机,如自 1.5.0 版本起,可选:指定要绕过已配置代理服务器的主机中所述。
- 确保 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器可以解析密钥分发中心 (KDC) 和管理服务器的完全限定域名。
- 使用 vCenter Web Client 的 Web 控制台选项,以用户 vcp_cli_user 身份登录到托管 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器的 VM。
- 确保 /etc/hosts 文件包含 KDC 和管理服务器的完全限定域名的条目。
- 在 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器上创建 krb5.conf 配置文件。
如果 Kerberos 已在您网络中的另一台服务器上配置,您可以从该服务器复制该文件。此文件的默认路径为 /etc/krb5.conf。否则,请按照以下示例中显示的格式创建文件。
[libdefaults] default_realm = EXAMPLE.COM [realms] EXAMPLE.COM = { kdc = vc-plugin-dc.EXAMPLE.COM admin_server = vc-plugin-dc.EXAMPLE.COM } [domain_realm] .linux.home = EXAMPLE.COM .example.com = EXAMPLE.COM example.com = EXAMPLE.COM
- 登录到您要为其配置代理服务器的 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器。
- 在左侧导航窗格中,单击设置。
- 在打开的“设置”页面上,在“代理服务器设置”部分中,单击“更新”。
- 在打开的“代理服务器设置”窗口的“服务器”部分中,提供代理服务器的详细信息。
- 指定代理服务器的完全限定域名或 IP 地址,以及代理服务器侦听客户端请求的端口。
- 选择“KERBEROS”身份验证类型。
- 提供用户名和密码,用于验证对代理服务器的访问权限以使用代理。
- 单击“Kerberos 配置文件”旁边的“选择文件”,然后在打开的文件浏览器中,导航到包含您在步骤 2 中创建的 krb5.conf 的文件夹,然后选择该文件。
- 自 1.5.0 版本起:如果您需要与某些主机的网络通信绕过代理服务器,请上传纯文本文件,其中指定了这些主机。
- 在“代理服务器设置”窗口的“例外”部分中,单击“选择文件”。
- 在打开的文件浏览器中,导航到包含指定这些主机的文本文件的文件夹,然后选择该文件。
注意- 如果之前已上传文件,则将被覆盖。
- 如果您在上传文件后更改了其他代理服务器设置,但未上传新文件,则现有文件将保留。
- 单击更新。
VMware vCenter 的 NVIDIA GPU 管理器验证代理服务器的正确运行,验证用于验证对代理服务器的访问权限的凭据以使用代理,并配置代理服务器。“事件”页面上会显示代理服务器已配置的确认信息。
在连接到 vCenter Server 实例时,VMware vCenter 的 NVIDIA GPU 管理器不通过 Kerberos 身份验证的代理服务器进行通信。对于所有其他通信,将使用 Kerberos 身份验证的代理服务器。
2.12.6. 自 1.5.0 版本起:禁用和启用已配置的代理服务器
默认情况下,已配置的代理服务器处于启用状态。为了简化在没有代理服务器的情况下测试 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器的行为,您可以禁用代理服务器。禁用代理服务器后,与所有主机的网络通信都将绕过代理服务器。测试完成后,您可以再次启用代理服务器。
- 登录到您要为其启用或禁用已配置代理服务器的 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器。
- 在左侧导航窗格中,单击设置。
- 在打开的“设置”页面上,在“代理服务器设置”部分中,单击“更新”。
- 在打开的“代理服务器设置”窗口中,单击按钮以禁用或启用代理服务器。
- 要禁用代理服务器,请单击“禁用”。
- 要启用代理服务器,请单击“启用”。
通过注册 VMware vCenter 的 NVIDIA GPU 管理器,您可以从 vSphere Client 下载和管理 NVIDIA GPU 驱动程序。当您不再需要能够从 vSphere Client 下载和管理 NVIDIA GPU 驱动程序时,请取消注册 VMware vCenter 的 NVIDIA GPU 管理器。
3.1. 注册和取消注册 VMware vCenter 的 NVIDIA GPU 管理器所需的权限
注册和取消注册 VMware vCenter 的 NVIDIA GPU 管理器需要用于安装和管理扩展、配置 vSphere Lifecycle Manager 服务、管理仓库和修复策略以及管理 VMware vCenter 上的证书的权限。
具有 vCenter Server 管理员权限的用户拥有注册和取消注册 VMware vCenter 的 NVIDIA GPU 管理器所需的所有权限。没有完全 vCenter Server 管理员权限的用户需要以下 vCenter Server 权限
- 扩展权限
- 注册扩展
- 取消注册扩展
- 更新扩展
- VMware vSphere Lifecycle Manager 配置权限
- 配置服务
- VMware vSphere Lifecycle Manager 设置权限
- 读取
- 写入
- VMware vSphere Lifecycle Manager 仓库权限
- 删除
- 证书管理权限
- 创建/删除(管理员权限)
- 创建/删除(低于管理员权限)
当为用户分配使用这些权限创建的角色时,请确保设置“传播到子项”选项。
3.2. 注册 VMware vCenter 的 NVIDIA GPU 管理器
注册 VMware vCenter 的 NVIDIA GPU 管理器会创建一个存储下载的 NVIDIA GPU 驱动程序的存储库。注册 VMware vCenter 的 NVIDIA GPU 管理器后,您可以从 vSphere Client 下载和管理 NVIDIA GPU 驱动程序。
一个 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器最多可以注册到 五个 vCenter Server 实例。
- 登录到您要注册的 VMware vCenter 的 NVIDIA GPU 管理器的虚拟设备。
- 在左侧导航窗格中,单击“注册”。
- 在打开的“注册”页面上,单击“注册”。
- 在打开的“注册 NVIDIA GPU 管理器”窗口中,提供您要注册 VMware vCenter 的 NVIDIA GPU 管理器的 vCenter Server 实例的详细信息,然后单击“注册”。
- 在“vCenter Server”文本输入字段中,键入 vCenter Server 主机的完全限定域名或 IP 地址。
- 在“用户名”文本输入字段中,键入将登录到 vCenter Server 主机的用户的用户名。
- 在“密码”文本输入字段中,键入将登录到 vCenter Server 主机的用户的密码。
已注册 VMware vCenter 的 NVIDIA GPU 管理器的 vCenter Server 实例的条目将添加到“注册”页面。使用 vSphere Client 验证 VMware vCenter 的 NVIDIA GPU 管理器是否已注册。
3.3. 验证 VMware vCenter 的 NVIDIA GPU 管理器的注册
注册 VMware vCenter 的 NVIDIA GPU 管理器后,确认它已在 vSphere Client 的“客户端插件”和“补丁程序设置”页面上列出。
- 使用 VMware vSphere Client 登录到 vCenter Server。有关更多信息,请参阅 VMware Docs 站点上的使用 vSphere Web Client 登录到 vCenter Server。
- 从“vSphere Client”菜单中,选择“管理”>“解决方案”>“客户端插件”,并确认 NVIDIA GPU 管理器显示在“客户端插件”表格中。
- 从“vSphere Client”菜单中,选择“Lifecycle Manager”,单击“设置”选项卡,选择“管理”>“补丁程序设置”,并确认 NVIDIA GPU 管理器驱动程序存储库显示在表格中。
在确认 VMware vCenter 的 NVIDIA GPU 管理器的注册后,您可以按照从 vSphere Client 管理 NVIDIA GPU 驱动程序中所述管理 NVIDIA GPU 驱动程序。
3.4. 取消注册 VMware vCenter 的 NVIDIA GPU 管理器
当您不再需要能够从 vSphere Client 下载和管理 NVIDIA GPU 驱动程序时,请取消注册 VMware vCenter 的 NVIDIA GPU 管理器。取消注册 VMware vCenter 的 NVIDIA GPU 管理器会删除下载的 NVIDIA GPU 驱动程序存储库的 URL。驱动程序存储库(包括其包含的已下载驱动程序文件)保持不变,并且可以通过重新注册 VMware vCenter 的 NVIDIA GPU 管理器再次访问。
- 登录到您要取消注册的 VMware vCenter 的 NVIDIA GPU 管理器的虚拟设备。
- 在左侧导航窗格中,单击“注册”。
- 在打开的“注册”页面上,为您要从中取消注册 VMware vCenter 的 NVIDIA GPU 管理器的 vCenter Server 主机单击“取消注册”。
- 在打开的“取消注册 NVIDIA GPU 管理器”窗口中,提供将登录到此 vCenter Server 主机的用户的凭据,然后单击“取消注册”。
- 在“用户名”文本输入字段中,键入将登录到 vCenter Server 主机的用户的用户名。
- 在“密码”文本输入字段中,键入将登录到 vCenter Server 主机的用户的密码。
已从中取消注册 VMware vCenter 的 NVIDIA GPU 管理器的 vCenter Server 实例的条目将从“注册”页面中删除。使用 vSphere Client 验证 VMware vCenter 的 NVIDIA GPU 管理器是否已取消注册。
3.5. 验证 VMware vCenter 的 NVIDIA GPU 管理器的取消注册
取消注册 VMware vCenter 的 NVIDIA GPU 管理器后,确认它不再在 vSphere Client 的“客户端插件”和“补丁程序设置”页面上列出。
- 使用 VMware vSphere Client 登录到 vCenter Server。有关更多信息,请参阅 VMware Docs 站点上的使用 vSphere Web Client 登录到 vCenter Server。
- 从“vSphere Client”菜单中,选择“管理”>“解决方案”>“客户端插件”,并确认 NVIDIA GPU 管理器不再显示在“客户端插件”表格中。
- 从“vSphere Client”菜单中,选择“Lifecycle Manager”,单击“设置”选项卡,选择“管理”>“补丁程序设置”,并确认 NVIDIA GPU 管理器驱动程序存储库不再显示在表格中。
如果 NVIDIA GPU 管理器驱动程序存储库仍然显示在表格中,您必须按照 VMware Docs 站点上的修改下载源中所述手动删除它。
注册 VMware vCenter 的 NVIDIA GPU 管理器后,您可以使用 vSphere Client 从 NVIDIA 许可门户下载驱动程序到 NVIDIA GPU 管理器驱动程序存储库。将下载的驱动程序与 vSphere Lifecycle Management (vLCM) 同步后,您可以在 ESXi 主机上安装下载的驱动程序。要释放 NVIDIA GPU 管理器驱动程序存储库中的存储空间,请删除任何不再使用的下载驱动程序。
当您登录到 vSphere Client 以管理 NVIDIA GPU 驱动程序时,请在 vSphere Client 的 URL 中指定完全限定域名或 IP 地址。为避免出现 插件访问检查失败
错误的可能性,请勿指定 VMware vCenter Server 主机的主机名。如果 NVIDIA GPU 管理器无法解析主机名,则会发生此错误。
4.1. 从 vSphere Client 管理 NVIDIA GPU 驱动程序所需的权限
从 vSphere Client 管理 NVIDIA GPU 驱动程序需要用于配置 vSphere Lifecycle Manager 服务、管理仓库和修复策略以及管理 VMware vCenter 上的基线和基线组的权限。
具有 vCenter Server 管理员权限的用户拥有从 vSphere Client 管理 NVIDIA GPU 驱动程序所需的所有权限。没有完全 vCenter Server 管理员权限的用户需要以下 vCenter Server 权限
- VMware vSphere Lifecycle Manager 配置权限
- 配置服务
- VMware vSphere Lifecycle Manager 设置权限
- 读取
- 写入
- VMware vSphere Lifecycle Manager 管理基线权限
- 附加基线
当为用户分配使用这些权限创建的角色时,请确保设置“传播到子项”选项。
4.2. 创建软件下载 API 密钥
从 NVIDIA 许可门户自动下载 NVIDIA 软件需要软件下载 API 密钥进行身份验证。此密钥是下载 NVIDIA GPU 驱动程序或 VMware vCenter 虚拟设备更新的 NVIDIA GPU 管理器所必需的。
- 如果您尚未登录,请登录到 NVIDIA 企业应用程序中心,然后单击“NVIDIA 许可门户”转到 NVIDIA 许可门户。
- 在 NVIDIA 许可门户仪表板的左侧导航窗格中,单击“API 密钥”。
- 在打开的“API 密钥管理”窗口中,单击“创建 API 密钥”。
- 在打开的“创建 API 密钥”窗口中,提供密钥的名称、访问类型和生存期,然后单击“创建 API 密钥”。
- 在“密钥名称”文本输入字段中,键入您为密钥选择的名称。
- 从“访问类型”下拉列表中,选择“软件下载”。
- 接受 NVIDIA vGPU 软件使用许可协议。
- 在“到期天数”文本输入字段中,键入密钥的生存期(以天为单位),或者,如果您不希望密钥到期,请取消选中“此密钥在指定天数后过期?”选项。
密钥将添加到“API 密钥管理”窗口中的 API 密钥表中。
- 当您准备好使用软件下载 API 密钥时,请单击“查看 API 密钥”链接,然后将密钥复制到剪贴板。
按照配置带有软件下载 API 密钥的 vSphere Client中所述,使用您创建的 API 密钥配置 vSphere Client。
4.3. 配置带有软件下载 API 密钥的 vSphere Client
创建软件下载 API 密钥后,在使用客户端下载和管理 NVIDIA GPU 驱动程序之前,请使用密钥配置 vSphere Client。对于任何 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器,您只需要配置一次 API 密钥。该密钥将应用于设备注册的每个 vCenter Server 实例的 vSphere Client。
确保您已按照创建软件下载 API 密钥中所述创建了软件下载 API 密钥。
- 使用 VMware vSphere Client 登录到 vCenter Server。有关更多信息,请参阅 VMware Docs 站点上的使用 vSphere Web Client 登录到 vCenter Server。
- 从“vSphere Client”菜单中,选择“NVIDIA GPU Manager”。
- 确保您已将软件下载 API 密钥复制到剪贴板。
- 在“驱动程序下载”选项卡上,将复制的 API 密钥粘贴到“NVIDIA 许可门户 API 密钥”文本输入字段中,然后单击“应用”。
如果“驱动程序下载”选项卡显示消息 API 密钥无效或已过期
,请创建另一个软件下载 API 密钥并使用它配置 vSphere Client。
4.4. 下载和同步 NVIDIA GPU 驱动程序
您可以从 NVIDIA 许可门户下载的 NVIDIA GPU 驱动程序取决于您的 NVIDIA 软件权利条款。下载驱动程序并将其与 vSphere Lifecycle Management (vLCM) 同步后,您可以在 ESXi 主机上安装下载的驱动程序。
- 使用 VMware vSphere Client 登录到 vCenter Server。有关更多信息,请参阅 VMware Docs 站点上的使用 vSphere Web Client 登录到 vCenter Server。
- 从“vSphere Client”菜单中,选择“NVIDIA GPU Manager”。
- 在“驱动程序下载”选项卡上,选择您要下载的每个驱动程序,然后单击“下载所选”。
如有必要,单击“刷新目录”以更新您可以从 NVIDIA 许可门户下载的驱动程序列表。
注意对于单个下载,您最多可以选择 10 个驱动程序。
由于每个下载都很大,因此在一个下载正在进行时,您无法启动新的下载。
- 下载完成后,将下载的驱动程序与 vLCM 同步。
- 从“vSphere Client”菜单中,选择“Lifecycle Manager”。
- 在“Lifecycle Manager”页面上,从“操作”菜单中,选择“同步更新”。
- 确认下载的驱动程序已与 vLCM 同步。
- 从“vSphere Client”菜单中,选择“Lifecycle Manager”。
- 在“Lifecycle Manager”页面的“映像仓库”选项卡上,单击“组件”,并确认下载的驱动程序显示在表格中。
下载驱动程序并将其与 vLCM 同步后,按照 VMware Docs 站点上的以下主题中所述在 ESXi 主机上安装下载的驱动程序
4.5. 删除下载的 NVIDIA GPU 驱动程序
在 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器上,保留 15 GB 的存储空间用于 NVIDIA GPU 管理器驱动程序存储库。要释放一些存储空间,请从存储库中删除未使用的驱动程序。
- 使用 VMware vSphere Client 登录到 vCenter Server。有关更多信息,请参阅 VMware Docs 站点上的使用 vSphere Web Client 登录到 vCenter Server。
- 从“vSphere Client”菜单中,选择“NVIDIA GPU Manager”。
- 单击“管理驱动程序”选项卡,选择您要删除的每个下载的驱动程序,然后单击“删除所选下载”。
“管理驱动程序”选项卡显示下载到 NVIDIA GPU 管理器驱动程序存储库的驱动程序总数以及驱动程序的总大小(GB)。
注意从 NVIDIA GPU 管理器驱动程序存储库中删除驱动程序不会从 VLCM 中删除驱动程序的条目。
维护 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器包括就地更新虚拟设备以进行次要更改,以及在新版本的虚拟设备软件发布时升级虚拟设备以进行主要更改。
5.1. 更新 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器
NVIDIA 定期发布 VMware vCenter 的 NVIDIA GPU 管理器的更新,其中包含次要更改,例如安全更新和错误修复。您可以在现有虚拟设备上就地安装这些更新。VMware vCenter 的 NVIDIA GPU 管理器会自动检查 NVIDIA 许可门户上的新更新。
确保已为设备注册的 vCenter Server 实例的 vSphere Client 配置了 API 密钥。有关更多信息,请参阅配置带有软件下载 API 密钥的 vSphere Client。
为防止更新失败时数据丢失,请在更新虚拟设备之前创建其快照,如拍摄虚拟机快照中所述。如果更新失败,您可以按照还原虚拟机快照中所述从快照还原虚拟设备。
- 登录到您要更新的 VMware vCenter 的 NVIDIA GPU 管理器的虚拟设备。
- 在左侧导航栏中,单击“维护”。
- 如果有任何更新可用,请在打开的“维护”页面上,单击“安装更新”。
如果虚拟设备是最新的,“维护”页面将显示一条消息,指示没有新更新可用。“安装更新”按钮将被停用并灰显。
注意在安装更新期间,设备上的 NVIDIA GPU 管理器应用程序及其基于 Web 的管理界面将不可用。
安装更新后,“事件”页面上会显示安装确认信息。确认 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器已更新。
- 确认 vSphere Client 显示了 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器的正确版本。
- 确认 vSphere Lifecycle Management (vLCM) 中的同步更新操作成功。
5.2. 升级 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器
NVIDIA 在新版本的 VMware vCenter 虚拟设备软件的 NVIDIA GPU 管理器中分发主要升级,包括新功能。您可以在新的虚拟设备上并排安装这些升级,然后将数据从现有虚拟设备迁移到新的虚拟设备。
以下数据将从现有虚拟设备迁移到新的虚拟设备
- 配置文件
- API 密钥
- 注册的 vCenter Server 实例
- 下载的驱动程序
- 为并排升级准备新的 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器。
- 在新虚拟机上安装新版本的 VMware vCenter 虚拟设备软件的 NVIDIA GPU 管理器。有关说明,请参阅安装 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器。
- 在上一步中创建的 VMware vCenter 虚拟设备的 NVIDIA GPU 管理器上注册 NVIDIA GPU 管理器管理员用户。有关说明,请参阅注册 VMware vCenter 的 NVIDIA GPU 管理器管理员用户。
- 登录到您要升级的现有虚拟设备。
- 在左侧导航栏中,单击“维护”。
- 在打开的“维护”页面上,单击“迁移数据”。
- 在打开的“迁移数据”窗口中,提供新的虚拟设备的详细信息,然后单击“迁移”。
- 在“虚拟设备”文本输入字段中,键入新的虚拟设备的完全限定域名或 IP 地址。
- 在“密码”文本输入字段中,键入您在新虚拟设备上注册的 vcp_admin 用户的密码。
数据迁移到新的虚拟设备可能需要 10 到 30 分钟。在迁移期间,vSphere Client 上的 NVIDIA GPU 管理器无法执行驱动程序下载操作。
注意请勿在迁移期间使用 NVIDIA GPU 管理器。
- 登录到新的适用于 VMware vCenter 的 NVIDIA GPU 管理器虚拟设备,并确认它已注册到旧虚拟设备注册的所有 vCenter Server 实例。
- 使用 vSphere Client 验证新的虚拟设备及其 NVIDIA GPU 管理器驱动程序存储库是否已注册。
有关说明,请参阅验证适用于 VMware vCenter 的 NVIDIA GPU 管理器的注册。
如果旧虚拟设备的 NVIDIA GPU 管理器驱动程序存储库的完全限定域名或 IP 地址出现在表中,请将其删除。
- 使用您的虚拟机监控程序软件的标准界面,从虚拟机监控程序主机中删除旧虚拟设备。
升级完成后,适用于 VMware vCenter 的 NVIDIA GPU 管理器已注册并可供使用。“事件”页面上会显示升级确认信息。确认适用于 VMware vCenter 的 NVIDIA GPU 管理器虚拟设备已升级。
- 确认 vSphere Client 显示适用于 VMware vCenter 的 NVIDIA GPU 管理器虚拟设备的正确版本和 IP 地址或完全限定域名。
- 确认 vSphere Lifecycle Management (vLCM) 中的同步更新操作成功。
6.1. 从适用于 VMware vCenter 的 NVIDIA GPU 管理器虚拟设备下载日志文件
为了帮助 NVIDIA 企业支持进行故障排除,您可以从适用于 VMware vCenter 的 NVIDIA GPU 管理器虚拟设备下载 /var/log 目录中的日志文件。
- 登录到您要从中下载日志文件的适用于 VMware vCenter 的 NVIDIA GPU 管理器虚拟设备。
- 在左侧导航栏中,单击事件。
- 在打开的“事件”页面上,单击导出事件。名为 log_bundle.zip 的文件将保存到您的默认下载文件夹中。
6.2. 无法使用 Firefox 或 Safari 访问 NVIDIA GPU 管理器管理界面
适用于 VMware vCenter 的 NVIDIA GPU 管理器虚拟设备为设备上的 NVIDIA GPU 管理器应用程序提供基于 Web 的管理界面。设备的日期和时间与部署该设备的 ESXi 主机上的日期和时间同步。如果 ESXi 主机的日期和时间设置不准确,则由于 Firefox 或 Safari Web 浏览器对 Cookie 过期的严格安全要求,将无法访问管理界面。
确保 ESXi 主机的日期和时间设置准确,例如,通过使用 NTP。有关如何在 ESXi 主机上配置 NTP 的信息,请参阅VMware 知识库文章:使用 vSphere Client 在 ESXi 主机上配置网络时间协议 (NTP) (57147)。
6.3. 在适用于 VMware vCenter 的 NVIDIA GPU 管理器仍注册时,虚拟设备 VM 已被删除
适用于 VMware vCenter 的 NVIDIA GPU 管理器从虚拟设备上的 NVIDIA GPU 管理器应用程序中注销。如果虚拟设备 VM 已被删除,请在 Web 浏览器中使用 vCenter 受管对象浏览器 (MOB) 界面手动删除适用于 VMware vCenter 的 NVIDIA GPU 管理器扩展。
- 打开 Web 浏览器并连接到 URL
https://<i>vcenter-server-ip-address</i>/mob/?moid=ExtensionManager&method=unregisterExtension
。- vcenter-server-ip-address
- 您的 vCenter Server 实例的 IP 地址,或者如果已定义,则为完全限定域名。
- 出现提示时,使用 vCenter Server 实例上 vCenter Server 管理员用户的用户名和密码登录。“void UnregisterExtension”页面将打开。
- 在extensionKey值的文本框中,键入 com.nvidia.gpu.manager。
- 单击调用方法链接。
- 确认 vSphere Client 的“客户端插件”页面上不再列出适用于 VMware vCenter 的 NVIDIA GPU 管理器。
- 使用 VMware vSphere Client 登录到 vCenter Server。有关更多信息,请参阅 VMware Docs 站点上的使用 vSphere Web Client 登录到 vCenter Server。
- 从“vSphere Client”菜单中,选择“管理”>“解决方案”>“客户端插件”,并确认 NVIDIA GPU 管理器不再显示在“客户端插件”表格中。
- 手动删除 NVIDIA GPU 管理器驱动程序存储库的条目,如 VMware Docs 站点上的修改下载源中所述。
6.4. 无法注册适用于 VMware vCenter 的 NVIDIA GPU 管理器
为了与 NVIDIA GPU 管理器通信,VMware vCenter Server 必须信任适用于 VMware vCenter 的 NVIDIA GPU 管理器设备上的 SSL 证书。当您注册适用于 VMware vCenter 的 NVIDIA GPU 管理器时,VMware vCenter Server 首先将 SSL 证书导入到其信任存储中。如果无法导入 SSL 证书,则适用于 VMware vCenter 的 NVIDIA GPU 管理器的注册可能会失败。
- 手动导入证书。有关说明,请参阅VMware 知识库文章:由于“自签名证书”错误,将新的在线仓库添加到 vCenter Server 7.0 U2C 及更高版本的 vCenter Life Cycle Manager 失败 (85819)。
- 再次尝试注册适用于 VMware vCenter 的 NVIDIA GPU 管理器。有关说明,请参阅注册适用于 VMware vCenter 的 NVIDIA GPU 管理器。
声明
本文档仅供参考,不得视为对产品的特定功能、条件或质量的保证。NVIDIA Corporation(“NVIDIA”)对本文档中包含信息的准确性或完整性不做任何明示或暗示的陈述或保证,并且对本文档中包含的任何错误不承担任何责任。NVIDIA 对因使用此类信息或因使用此类信息而可能导致的侵犯第三方专利或其他权利的行为的后果或使用不承担任何责任。本文档不承诺开发、发布或交付任何材料(下文定义)、代码或功能。
NVIDIA 保留随时对本文档进行更正、修改、增强、改进和任何其他更改的权利,恕不另行通知。
客户在下订单前应获取最新的相关信息,并应验证此类信息是否为最新且完整。
NVIDIA 产品的销售受订单确认时提供的 NVIDIA 标准销售条款和条件的约束,除非 NVIDIA 和客户的授权代表签署的个别销售协议(“销售条款”)另有约定。NVIDIA 特此明确反对将任何客户通用条款和条件应用于购买本文档中引用的 NVIDIA 产品。本文档不直接或间接地形成任何合同义务。
NVIDIA 产品并非设计、授权或保证适用于医疗、军事、航空、航天或生命维持设备,也不适用于 NVIDIA 产品的故障或失灵可能合理预期会导致人身伤害、死亡或财产或环境损害的应用。对于在上述设备或应用中包含和/或使用 NVIDIA 产品,NVIDIA 不承担任何责任,因此,此类包含和/或使用由客户自行承担风险。
NVIDIA 不保证或声明基于本文档的产品将适用于任何特定用途。NVIDIA 不一定对每个产品的所有参数进行测试。客户全权负责评估和确定本文档中包含的任何信息的适用性,确保产品适合并符合客户计划的应用,并为应用执行必要的测试,以避免应用或产品的默认设置。客户产品设计中的缺陷可能会影响 NVIDIA 产品的质量和可靠性,并可能导致超出本文档中包含的附加或不同条件和/或要求。NVIDIA 对可能基于或归因于以下原因的任何默认设置、损坏、成本或问题不承担任何责任:(i) 以任何与本文档相反的方式使用 NVIDIA 产品,或 (ii) 客户产品设计。
本文档未授予 NVIDIA 专利权、版权或其他 NVIDIA 知识产权下的任何明示或暗示的许可。NVIDIA 发布的有关第三方产品或服务的信息并不构成 NVIDIA 授予使用此类产品或服务的许可,也不构成 NVIDIA 对其的保证或认可。使用此类信息可能需要获得第三方专利或其他知识产权下的第三方许可,或获得 NVIDIA 专利或其他 NVIDIA 知识产权下的 NVIDIA 许可。
只有在事先获得 NVIDIA 书面批准的情况下,才允许复制本文档中的信息,并且复制必须在不进行更改且完全遵守所有适用的出口法律和法规的情况下进行,并且必须附带所有相关的条件、限制和声明。
本文档和所有 NVIDIA 设计规范、参考板、文件、图纸、诊断程序、列表和其他文档(统称为“材料”)均按“原样”提供。NVIDIA 对材料不做任何明示、暗示、法定或其他形式的保证,并且明确否认所有关于不侵权、适销性和特定用途适用性的暗示保证。在法律未禁止的范围内,在任何情况下,NVIDIA 均不对任何损害负责,包括但不限于任何直接、间接、特殊、附带、惩罚性或后果性损害,无论因何种原因引起,也无论责任理论如何,即使 NVIDIA 已被告知可能发生此类损害。尽管客户可能因任何原因遭受任何损害,但 NVIDIA 对本文所述产品的总累积责任应根据产品的销售条款进行限制。
VESA DisplayPort
DisplayPort 和 DisplayPort Compliance Logo、DisplayPort Compliance Logo for Dual-mode Sources 和 DisplayPort Compliance Logo for Active Cables 是视频电子标准协会在美国和其他国家/地区拥有的商标。
HDMI
HDMI、HDMI 徽标和 High-Definition Multimedia Interface 是 HDMI Licensing LLC 的商标或注册商标。
OpenCL
OpenCL 是 Apple Inc. 的商标,已获得 Khronos Group Inc. 的许可使用。
商标
NVIDIA、NVIDIA 徽标、NVIDIA GRID、NVIDIA GRID vGPU、NVIDIA Maxwell、NVIDIA Pascal、NVIDIA Turing、NVIDIA Volta、Quadro 和 Tesla 是 NVIDIA Corporation 在美国和其他国家/地区的商标或注册商标。其他公司和产品名称可能是与其相关的各自公司的商标。