AI vWS 工具包 - 使用 RTX 虚拟工作站构建 RAG 应用程序

快速入门指南

在您使用 RTX 虚拟工作站构建 RAG 应用程序时,请参考本指南。

在开始之前,请完成以下步骤以获取必要的软件和硬件组件。

所需软件

  • Hypervisor(虚拟机监控程序): vGPU 支持的虚拟机监控程序

  • NVIDIA vGPU 软件:vGPU 17.4 或更高版本

  • Linux 虚拟机操作系统:Ubuntu 24.04 或 Ubuntu 22.04

  • 在此处下载 NVIDIA AI Workbench for Ubuntu here (AI vWS 后端)

    警告

  • 激活、下载并安装您的 RTX 虚拟工作站许可证

  • 选择并下载一个大型语言模型(建议使用 LLaMa 3-8B),该模型可以从 Hugging Face 或 GitHub 获取,用于构建 RAG 应用程序

重要提示

还没有许可证?申请免费的 90 天评估许可证

所需硬件

配备 NVIDIA L40S、L40、L4、A40、A10 或 T4 的 NVIDIA vGPU 认证系统。查看 NVIDIA vGPU 认证服务器列表。

  • Linux 虚拟机配置的最低要求:8 个 vCPU,32 GB 系统内存,120 GB 存储

  • Linux 虚拟机推荐的 vGPU 配置文件:16Q(4 位模型)或 24Q(8 位模型)

上一步 简介
下一步 部署指南
© 版权所有 © 2013-2025,NVIDIA Corporation。 上次更新于 2025 年 1 月 23 日。