安装 NVIDIA Network Operator (可选)#

在 2.0 版本中添加。

接下来,我们将安装 NVIDIA Network Operator。这仅适用于您的工作节点具有 NVIDIA Networking 的情况。Network Operator 的目标是安装主机网络组件,以在 Kubernetes 集群中启用 RDMA 和 GPUDirect。它通过在每个集群节点中的辅助网络上为 IO 密集型工作负载配置高速数据路径来实现这一点。

  1. 选择 Operator > Operator Hub,并搜索 NVIDIA Network Operator

  2. 选择 NVIDIA Network Operator,然后在第一个屏幕和后续屏幕中单击安装

    注意

    有关更多信息,请参阅 Red Hat OpenShift Container Platform 文档

  3. 要验证 Operator 部署是否成功,请运行

    $ oc get pods
    

    示例输出

    NAME                                      READY   STATUS    RESTARTS   AGE
    
    nvidia-network-operator-controller-manager-8f8ccf45c-zgfsq    2/2     Running   0          1
    
  4. 成功部署会显示正在运行状态。