NVIDIA AI 企业软件#

在版本 2.0 中添加。

NVIDIA 驱动程序#

NVIDIA 驱动程序是安装在操作系统上的软件驱动程序，负责与 NVIDIA GPU 通信。

NVIDIA AI Enterprise 驱动程序可以通过以下方式获得：从 NVIDIA 企业许可门户、NVIDIA 驱动程序下载网页下载，或从 NGC Catalog 拉取。请查看NVIDIA AI Enterprise 快速入门指南，了解有关许可权利证书的更多详细信息。

安装 NGC Catalog CLI#

要访问 NVIDIA AI Enterprise 主机软件 (VIB) 和 NVIDIA vGPU 访客驱动程序，您必须首先下载并安装 NGC Catalog CLI。安装 NGC Catalog CLI 后，您需要启动命令窗口并运行以下命令来下载软件。

安装 NGC Catalog CLI

以访客用户身份进入 NVIDIA NGC 网站。
在右上角，单击“Welcome Guest”（欢迎访客），然后从菜单中选择“Setup”（设置）。
从“Setup”（设置）页面单击“Install NGC CLI”（安装 NGC CLI）下的“Downloads”（下载）。
从“CLI Install”（CLI 安装）页面，根据您运行 NGC Catalog CLI 的平台，单击“Windows”、“Linux”或“MacOS”选项卡。
按照说明安装 CLI。
从“运行”框中打开命令提示符。
通过输入 ngc --version 验证安装。输出应为 NGC Catalog CLI x.y.z，其中 x.y.z 表示版本。
输入以下命令 ngc config set。系统将提示您输入您的 NGC API 密钥。

安装 NVIDIA 驱动程序#

CLS 场景的安装步骤#

本节将介绍 CLS 用户正确安装、配置和许可 NVIDIA 驱动程序所需的步骤。

安装 NVIDIA 驱动程序#

现在您已安装 Linux，NVIDIA AI Enterprise 驱动程序将完全启用 GPU 操作。在继续 NVIDIA 驱动程序安装之前，请确认 Nouveau 已禁用。有关确认此操作的说明，请参见 RHEL 部分。

使用 NGC 下载 NVIDIA AI 企业软件驱动程序#

重要提示

在开始之前，您需要生成或使用现有的 API 密钥。

从浏览器中，转到 https://ngc.nvidia.com/signin/email，然后输入您的电子邮件和密码。
在右上角，单击您的用户帐户图标，然后选择 Setup（设置）。
单击 Get API Key（获取 API 密钥）以打开 Setup（设置）> API Key（API 密钥）页面。

注意

API 密钥是用于验证您对 NGC 容器注册表访问权限的机制。
单击 Generate API Key（生成 API 密钥）以生成您的 API 密钥。

注意

将出现警告消息，告知您如果创建新密钥，旧的 API 密钥将失效。
单击“Confirm”（确认）以生成密钥。
您的 API 密钥将出现。

重要提示

您只需生成一次 API 密钥。NGC 不会保存您的密钥，因此请将其存储在安全的地方。（您可以通过单击 API 密钥右侧的复制图标将 API 密钥复制到剪贴板。）如果您丢失了 API 密钥，可以从 NGC 网站生成一个新的密钥。当您生成新的 API 密钥时，旧的密钥将失效。

运行以下命令以安装适用于 AMD64 的 NGC CLI

AMD64 Linux 安装：Linux 版 NGC CLI 二进制文件在 Ubuntu 16.04 及更高版本发行版上受支持。

通过移动到您具有执行权限的目录，然后运行以下命令，从命令行下载、解压缩和安装
wget --content-disposition https://ngc.nvidia.com/downloads/ngccli_linux.zip && unzip ngccli_linux.zip && chmod u+x ngc-cli/ngc
注意

Windows NGC CLI、Arm64 MacOs 或 Intel MacOs 的 NGC CLI 安装程序可以在此处找到

检查二进制文件的 MD5 哈希值，以确保文件在下载过程中未损坏。
$ md5sum -c ngc.md5
将当前目录添加到路径。
$ echo "export PATH=\"\$PATH:$(pwd)\"" >> ~/.bash_profile && source ~/.bash_profile
您必须配置 NGC CLI 以供您使用，以便您可以运行命令。输入以下命令，并在提示时输入您的 API 密钥。
 1$ ngc config set
 2
 3Enter API key [no-apikey]. Choices: [<VALID_APIKEY>, 'no-apikey']:
 4
 5Enter CLI output format type [ascii]. Choices: [ascii, csv, json]: ascii
 6
 7Enter org [no-org]. Choices: ['no-org']:
 8
 9Enter team [no-team]. Choices: ['no-team']:
10
11Enter ace [no-ace]. Choices: ['no-ace']:
12
13Successfully saved NGC configuration to /home/$username/.ngc/config
下载 NVIDIA AI 企业软件驱动程序。

使用 .run 文件通过 RHEL 安装 NVIDIA 驱动程序#

重要提示

在开始驱动程序安装之前，需要禁用安全启动，如安装 Red Hat Enterprise Linux 8.4 部分所示。

使用 subscription-manager 和以下命令将计算机注册到 RHEL。
$ subscription-manager register

满足 DKMS 的 EPEL 外部依赖项。

$ dnf install https://dl.fedoraproject.org/pub/epel/epel-release-latest-9.noarch.rpm

对于 RHEL 8，确保系统具有来自 Red Hat 存储库的正确 Linux 内核源代码。
$ dnf install -y kernel-devel-$(uname -r) kernel-headers-$(uname -r)
注意

NVIDIA 驱动程序要求在驱动程序安装时以及每次重建驱动程序时，都必须安装正在运行的内核版本的内核头文件和开发包。例如，如果您的系统正在运行内核版本 4.4.0，则还必须安装 4.4.0 内核头文件和开发包。

安装 NVIDIA 驱动程序的其他依赖项。

$ dnf install elfutils-libelf-devel.x86_64
$ dnf install -y tar bzip2 make automake gcc gcc-c++ pciutils libglvnd-devel

更新正在运行的内核

$ dnf install -y kernel kernel-core kernel-modules

更新后，确认系统具有来自 Red Hat 存储库的正确 Linux 内核源代码。
$ dnf install -y kernel-devel-$(uname -r) kernel-headers-$(uname -r)
下载 NVIDIA AI 企业软件驱动程序。
$ ngc registry resource download-version "nvaie/vgpu_guest_driver_x_x:xxx.xx.xx"
注意

其中 x_x:xxx.xx.xx 是来自 NGC Catalog 的当前驱动程序版本。
导航到包含 NVIDIA 驱动程序 .run 文件的目录。然后，使用 chmod 命令将 Executable（可执行）权限添加到 NVIDIA 驱动程序文件。
1$ sudo chmod +x NVIDIA-Linux-x86_64-xxx.xx.xx-grid.run
注意

其中 xxx.xx.xx 是来自 NGC Catalog 的当前驱动程序版本。
从控制台 shell 中，运行驱动程序安装程序并接受默认设置。
$ sudo sh ./NVIDIA-Linux-x86_64-xxx.xx.xx-grid.run
注意

其中 xxx.xx.xx 是来自 NGC Catalog 的当前驱动程序版本。

注意

接受任何警告并忽略 CC 版本检查
重启系统。
$ sudo reboot
系统重启后，确认您可以在 nvidia-smi 的输出中看到您的 NVIDIA vGPU 设备。
$ nvidia-smi

安装 NVIDIA vGPU 计算驱动程序后，您可以许可您正在使用的任何 NVIDIA AI 企业软件许可产品。