附录 A:Helm Chart 值#
部署参数#
名称 |
描述 |
值 |
---|---|---|
|
部署的 Affinity 设置。允许将 Pod 约束到节点。 |
|
|
指定容器的特权和访问控制设置(仅影响主容器)。 |
|
|
向主容器添加任意环境变量 - 键值对。 |
|
|
向部署集定义添加任意附加卷。 |
|
|
NIM-LLM 镜像仓库。 |
|
|
镜像标签。 |
|
|
镜像拉取策略。 |
|
|
指定主容器和任何 init 容器所需的密钥名称。对象键是密钥的名称。 |
|
|
指定标签以确保 NeMo Inference 仅部署在某些节点上(根据集群设置,最好将其设置为 |
|
|
指定要添加到主部署 Pod 的附加注解。 |
|
|
指定 Pod 的特权和访问控制设置(仅影响主 Pod)。 |
|
|
指定 Pod 的用户 UID。 |
|
|
指定 Pod 的组 ID。 |
|
|
指定文件系统所有者组 ID。 |
|
|
指定部署的副本计数。 |
|
|
指定运行服务的资源限制和请求。 |
|
|
指定要提供给运行服务的 GPU 数量。 |
|
|
指定是否应创建服务帐户。 |
|
|
指定要添加到服务帐户的注解。 |
|
|
指定是否自动将服务帐户挂载到容器。 |
|
|
指定要使用的服务帐户的名称。如果未设置且 create 为 true,则会使用 fullname 模板生成名称。 |
|
|
指定 Pod 分配的容忍度。允许调度器调度具有匹配污点的 Pod。 |
自动扩缩参数#
用于自动扩缩的值。如果未启用自动扩缩,则会忽略这些值。应根据服务质量指标以及成本指标,按模型覆盖这些值。除非使用自定义指标 API(例如 prometheus-adapter),否则不建议这样做。CPU 和内存的标准指标在扩展 NIM 中的用途有限
名称 |
描述 |
值 |
---|---|---|
|
启用水平 Pod 自动扩缩器。 |
|
|
指定自动扩缩的最小副本数。 |
|
|
指定自动扩缩的最大副本数。 |
|
|
自动扩缩的指标数组。 |
|
Ingress 参数#
名称 |
描述 |
值 |
---|---|---|
|
启用 Ingress。 |
|
|
指定 Ingress 的类名。 |
|
|
指定 Ingress 的附加注解。 |
|
|
指定主机列表,每个主机包含路径列表。 |
|
|
指定主机名。 |
|
|
指定 Ingress 路径。 |
|
|
指定路径类型。 |
|
|
指定服务类型。可以是 nemo 或 openai – 确保您的模型服务于适当的端口。 |
|
|
指定 TLS secretName 和主机对的列表。 |
|
探针参数#
名称 |
描述 |
值 |
---|---|---|
|
启用存活探针。 |
|
|
存活探针 http 或 script,但目前未提供 script。 |
|
|
存活探针端点路径。 |
|
|
存活探针的初始延迟秒数。 |
|
|
存活探针的超时秒数。 |
|
|
存活探针的周期秒数。 |
|
|
存活探针的成功阈值。 |
|
|
存活探针的失败阈值。 |
|
|
启用就绪探针。 |
|
|
就绪探针端点路径。 |
|
|
就绪探针的初始延迟秒数。 |
|
|
就绪探针的超时秒数。 |
|
|
就绪探针的周期秒数。 |
|
|
就绪探针的成功阈值。 |
|
|
就绪探针的失败阈值。 |
|
|
启用启动探针。 |
|
|
启动探针端点路径。 |
|
|
启动探针的初始延迟秒数。 |
|
|
启动探针的超时秒数。 |
|
|
启动探针的周期秒数。 |
|
|
启动探针的成功阈值。 |
|
|
启动探针的失败阈值。 |
|
存储参数#
名称 |
描述 |
值 |
---|---|---|
|
指定设置以修改路径 |
|
|
启用持久卷。 |
|
|
指定现有声明。如果使用 existingClaim,请仅运行一个副本或使用 ReadWriteMany 存储设置。 |
|
|
指定持久卷存储类。如果为空(默认值),则不设置 storageClassName 规范,而选择默认的 provisioner。 |
|
|
指定在 Helm Chart 升级或删除时是否应保留持久卷。 |
|
|
如果需要 Chart 为 hostPath 用例创建 PV,则为 True。 |
|
|
指定 accessModes。如果使用 NFS 或类似的设置,则可以使用 ReadWriteMany。 |
|
|
指定声明的大小(例如 8Gi)。 |
|
|
使用 hostPath 在节点上的本地磁盘上配置模型缓存 – 适用于特殊情况。在使用此选项之前,应调查并了解安全隐患。 |
|
服务参数#
名称 |
描述 |
值 |
---|---|---|
|
指定部署的服务类型。 |
|
|
覆盖默认服务名称。 |
|
|
指定服务的 HTTP 端口。 |
|
|
指定要添加到服务的附加注解。 |
|
OpenTelemetry 参数#
名称 |
描述 |
值 |
---|---|---|
|
指定此 Chart 是否应部署 Zipkin 以用于指标。 |
|
|
指定此 Chart 是否应部署 OpenTelemetry 以用于指标。 |
|
|
指定此 Chart 是否应将指标汇集到 OpenTelemetry。 |
|
|
用于在容器中配置 OTEL 的环境变量,Chart 中包含合理的默认值。 |
|
|
为容器和指标收集设置的日志级别。 |
|
OpenTelemetry 配置可以在 values 部分中找到。
注意
根据您的需要配置 OpenTelemetry 导出器。提供的 Helm Chart 提供了将跟踪导出到 Zipkin 以及将指标导出到 OTLP 兼容接收器的示例配置,分别存储在 opentelemetry-collector.config.exporters.zipkin
和 opentelemetry-collector.config.exporters.otlp
中。
例如,如果您的指标设置以拉取方式运行,并且您想以 Prometheus 格式公开 NIM 指标,则可以通过将 OTLP 导出器替换为 Prometheus 导出器来实现。