NVIDIA 云原生技术

关于 NVIDIA 云原生技术
NVIDIA 云原生技术使开发者能够使用 Docker、Podman 和 Kubernetes 构建和运行 GPU 加速的容器。
自动化管理在 Kubernetes 中配置 GPU 所需的所有 NVIDIA 软件组件。
在 Red Hat 以安全为中心的企业级强化 Kubernetes 平台上使用 NVIDIA GPU。
运维和管理在 Kubernetes 中运行 LLM、嵌入和其他 NIM 微服务和模型的软件组件和服务的生命周期。
在 Kubernetes 集群中配置和管理 NVIDIA 网络资源。该 Operator 安装主机网络软件以提供高速网络连接。
对于未完全饱和 GPU 计算容量的工作负载,请使用分区 GPU。
收集 GPU 指标,以便与 Prometheus 等监控解决方案一起使用。
Kubernetes 的 NVIDIA 设备插件提供以下功能
- 暴露集群中每个节点上的 GPU 数量。
- 跟踪 GPU 的健康状况。
- 在 Kubernetes 集群中运行启用 GPU 的容器。
Kubernetes 的 NVIDIA GPU 特性发现自动为节点上的一组 GPU 生成标签。
使用容器运行时库和实用程序构建和运行 GPU 加速的容器。
NVIDIA GPU 将加速计算和人工智能带到边缘。
在混合云和多云环境中使用带有 Google Anthos 的 NVIDIA GPU。
NVIDIA 云原生堆栈是用于在 NVIDIA GPU 上运行云原生工作负载的软件集合。GitHub 存储库提供了入门安装指南。
在微服务架构中使用服务网格进行服务间通信。