创建集群策略实例#

在 2.0 版本中添加。

接下来，我们将创建集群策略，它负责维护策略资源以在集群中创建 Pod。

在 OpenShift 容器平台 Web 控制台中，从侧边菜单中选择 **Operators** > **已安装的 Operators**，然后单击 **NVIDIA GPU Operator**。
选择 **ClusterPolicy** 选项卡，然后单击 **创建 ClusterPolicy**。

注意

平台分配默认名称 *gpu-cluster-policy*。
展开 **Driver config** 和 **Licensing Config** 的下拉菜单。在标记为 **Config Map Name** 的文本框中，输入先前创建的许可证配置映射的名称（例如：licensing-config）。选中 **NLS Enabled** 复选框。请参考以下屏幕截图中的参数示例，并相应地修改值。

重要提示

这在创建 CLS 许可证配置映射的步骤 2 中已创建。
向下滚动以在 **Driver** 部分下指定 repository 路径、image``name 和 NVIDIA vGPU driver ``version。请参考以下屏幕截图中的参数示例，并相应地修改值。
展开 **高级配置** 菜单并指定 imagePullSecret。（例如：gpu-operator-secret）

重要提示

这在创建 CLS 许可证配置映射的步骤 3 中已创建。
单击 **创建**。

验证集群策略#

GPU 运算符将继续安装所有必需的组件，以在 OpenShift 集群中设置 NVIDIA GPU。

当安装成功时，新部署的 NVIDIA GPU 运算符的 ClusterPolicy gpu-cluster-policy 的状态将更改为 State:ready。

要从 CLI 验证 ClusterPolicy 安装，请使用

$ oc get nodes -o=custom-columns='Node:metadata.name,GPUs:status.capacity.nvidia\.com/gpu'

这将列出每个节点及其可供 Kubernetes 使用的 GPU 数量。

示例输出

$ oc get nodes -o=custom-columns='Node:metadata.name,GPUs:status.capacity.nvidia\.com/gpu'
Node                           GPUs
nvaie-ocp-7rfr8-master-0       <none>
nvaie-ocp-7rfr8-master-1       <none>
nvaie-ocp-7rfr8-master-2       <none>
nvaie-ocp-7rfr8-worker-7x5km   1
nvaie-ocp-7rfr8-worker-9jgmk   <none>
nvaie-ocp-7rfr8-worker-jntsp   1