发行说明#
版本 1.3.1#
添加了
NIM_SERVED_MODEL_NAME
环境变量。更新了 LangChain 剧本 以使用 Llama-3.2-NV-EmbedQA-1B-v2 NIM。
版本 1.3.0#
增加了对 Llama-3.2-NV-EmbedQA-1B-v2 嵌入模型的支持。
增加了通过 Matryoshka Representation Learning 对 动态嵌入大小 的支持(对于支持的模型)。
添加了
NIM_NUM_MODEL_INSTANCES
和NIM_NUM_TOKENIZERS
环境变量。增加了对底层 Triton Inference Server 进程中 动态批处理 的支持。
已知问题#
在 LangChain 剧本 中使用的当前版本的
langchain-nvidia-ai-endpoints
与 Llama-3.2-NV-EmbedQA-1B-v2 NIM 不兼容。
版本 1.2.0#
更新了 NV-EmbedQA-E5-v5 NIM 以使用 Triton Inference Server 24.08。
添加了 NIM_TRITON_GRPC_PORT 环境变量以设置 Triton Inference Server 的 gRPC 端口。
版本 1.1.0#
使用标准 NIM 库和工具更新了 NV-EmbedQA-E5-v5 NIM。
版本 1.0.1#
除了 NGC API 密钥(原始)之外,还增加了对 NGC 个人/服务 API 密钥的支持。
当运行带有预填充缓存(
NIM_CACHE_PATH
)的容器时,不再需要NGC_API_KEY
。更新了
list-model-profiles
命令以检查模型工件的正确位置。
版本 1.0.0#
摘要#
这是 NeMo Retriever 文本嵌入 NIM 的第一个正式版本。
嵌入模型#
NV-EmbedQA-E5-v5
NV-EmbedQA-Mistral7B-v2
Snowflake’s Arctic-embed-l