NVIDIA NIM 视觉语言模型 (VLMs)# 用户指南 概述 发行说明 入门指南 采样控制 配置 NIM 支持矩阵 性能 API 参考 可观测性 实用工具 模型配置文件 KV 缓存重用 (也称前缀缓存) 结构化生成 使用 Helm 部署 通知 致谢 EULA