使用服务网格安装 GPU Operator#

服务网格的特殊注意事项#

您可以在使用 Istio CNI 或 Linkerd CNI 提供的服务网格的集群中使用 NVIDIA GPU Operator。

将 Operator 与服务网格一起使用的典型考虑因素是 driver 容器的 k8s-driver-manager init 容器需要网络访问集群的 Kubernetes API 服务器。

数据平面(由 Istio CNI 或 Linkerd CNI 作为 sidecar 容器运行的代理实施)必须正在运行,pod 网络才能工作。代理 sidecar 容器仅在 pod 的 init 阶段之后启动,因此 init 容器无法与 API 服务器通信。

为了解决连接性挑战,NVIDIA 建议禁用 GPU Operator 命名空间的注入。有关更多信息,请参阅以下文档

标记命名空间以禁用注入#

  • 标记 Operator 命名空间以防止自动注入

    $ kubectl label namespace gpu-operator istio-injection=disabled
    

    或者,对于 Linkerd

    $ kubectl label namespace gpu-operator linkerd.io/inject=disabled
    

如果尚未安装 GPU Operator,请参阅 安装 NVIDIA GPU Operator 以获取有关自定义选项和常见安装方案的信息。