安装 NVIDIA DOCA OFED#
用于 Red Hat Enterprise Linux 的 NVIDIA DGX™ 软件堆栈不包含用于 Linux 的 NVIDIA DOCA™ OFED (OpenFabrics Enterprise Distribution) 软件。这是为了确保 DOCA OFED 软件(完整 DOCA 软件包的子集)与 Red Hat 发行版内核同步。本主题介绍如何在运行 Red Hat Enterprise Linux 的系统上下载、安装和升级 DOCA OFED 软件。
DOCA-Host 安装配置文件#
DOCA 软件包包含多个子集,称为 DOCA-Host 安装配置文件,它们是经过完整验证和测试的安装包。下表列出了可用的 DOCA-Host 配置文件
DOCA-Host 配置文件 |
描述 |
---|---|
doca-ofed |
允许您使用 DOCA-Host 软件包安装与 MLNX_OFED 相同的驱动程序和工具,但没有其他 DOCA 功能。 |
doca-network |
适用于只想使用 DOCA-Host 软件包网络功能的用户。 |
doca-all |
适用于想要使用 DOCA 驱动程序和库的全部功能(完整 DOCA-Host 安装)的用户。 |
更多信息,请参考NVIDIA DOCA 配置文件。
前提条件#
在安装不同版本的 DOCA OFED 软件之前,您必须删除系统上已安装的 DOCA OFED 或 MLNX_OFED 软件。
基于 Debian 的 Linux
# Remove the installed DOCA OFED software. $ for f in $( dpkg --list | grep doca | awk '{print $2}' ); do echo $f ; sudo apt remove --purge $f -y ; done # Remove the installed MLNX_OFED software. $ sudo /usr/sbin/ofed_uninstall.sh --force $ sudo apt-get autoremove
基于 RPM 的 Linux
# Remove the installed DOCA OFED software from the host. for f in $(rpm -qa | grep -i doca ) ; do sudo yum -y remove $f; done # Remove the installed MLNC_OFED software. sudo /usr/sbin/ofed_uninstall.sh --force sudo yum autoremove sudo yum makecache
下载并安装 NVIDIA RPM GPG 密钥。
下载 NVIDIA RPM-GPG-KEY-Mellanox-SHA256 密钥。
wget http://www.mellanox.com/downloads/ofed/RPM-GPG-KEY-Mellanox-SHA256
安装密钥。
sudo rpm --import RPM-GPG-KEY-Mellanox-SHA256
验证密钥是否已成功导入。
sudo rpm -q gpg-pubkey --qf '%{NAME}-%{VERSION}-%{RELEASE}\t%{SUMMARY}\n' | grep Mellanox
安装步骤#
DOCA-Host 软件包包含驱动程序、库和工具,以支持 NVIDIA® ConnectX®-7 适配器卡和 NVIDIA® BlueField®-3 DPU
配备 NVIDIA ConnectX-7 适配器卡的 DGX 系统#
要在主机上安装 doca-ofed 配置文件的 DOCA-Host 软件包,请执行以下操作:
打开安装文件页面,根据您想要的操作系统和架构选项下载 DOCA-Host 安装文件。
或者,您可以使用DOCA 下载页面下载安装文件。
解压 RPM 软件包。
sudo rpm -Uvh <repo_file>.rpm
使用
yum
命令执行更新。sudo yum makecache
确定您的主机上的内核版本是否受支持,如每个 DOCA-Host 安装配置文件支持的主机操作系统中所示。
如果内核版本不受支持,请按照DOCA Extra Package中描述的说明进行操作。
为 doca-ofed 配置文件安装运行
yum install
命令。sudo yum install -y doca-ofed
重新创建 initramfs 镜像。
sudo dracut -f
重启系统。
sudo systemctl reboot
使用 Red Hat Subscription-Manager 将您的新 Red Hat Enterprise Linux 系统注册到客户门户网站。
更多信息,请参考如何使用 Red Hat Subscription-Manager 在 Red Hat 客户门户网站注册和订阅 RHEL 系统?。
有关主机上 doca-ofed 配置文件安装的更多信息,请参考在主机上安装软件。
配备 BlueField-3 DPU 且处于 NIC 模式的 DGX 系统(可选)#
如果您的系统配备了 NVIDIA BlueField-3 DPU,请确保 DPU 设置为 NIC 模式(BlueField-3 的 NIC 模式),然后继续执行以下说明。
安装 RShim 驱动程序以管理和刷新 BlueField-3 DPU。
按照在主机上为目标 BlueField 安装先决条件中描述的步骤进行操作。
选择基于 RPM 的 Linux 的步骤。
确定 BlueField-3 设备 ID。
按照确定 BlueField 设备 ID中描述的说明进行操作。
在主机上安装 DOCA-Host 软件。
按照选定的 DOCA-Host 配置文件的说明安装 DOCA 驱动程序和工具,如在主机上安装软件中所述。
更多信息
MFT 下载说明:更新单个网络接口卡 (NIC) 的固件
更改 BlueField-3 BMC 默认密码:更改默认密码