发行说明#
本节提供 DGX OS 5 可用版本和升级的详细信息。
注意
软件升级是累积性的,这意味着您的系统将始终接收所有已安装软件组件的最新版本。存储库中的软件包也可能比当前的 DGX OS 版本更新。您应该评估来自所有相关版本和后续升级的信息和建议。
当前软件版本#
下表显示了 NVIDIA 和 Ubuntu 存储库中为 NVIDIA DGX 软件堆栈提供的软件包的当前版本信息。
组件 |
版本 |
附加信息 |
---|---|---|
GPU 驱动程序 |
||
GPU 驱动程序 |
||
CUDA 工具包 |
R550: 12.4 Update 1 下载 |
|
CUDA 工具包 |
R535: 12.2 Update 2 下载 |
|
MLNX_OFED |
||
DOCA OFED |
||
Inbox OFED |
39.0-1 |
仅适用于 DGX OS 6。 |
NCCL |
||
cuDNN |
||
DCGM |
||
GPUDirect Storage (GDS) |
|
|
NVIDIA Container Toolkit |
NVIDIA Container Toolkit 包括以下软件包
|
|
nvidia-peer-memory |
1.3 |
注意
下表提供了关于 NVIDIA DOCA™ Host 软件包与 doca-ofed 安装配置文件 v2.9.1 和 NVIDIA® OpenFabrics Enterprise Distribution for Linux (MLNX_OFED) v24.10-1.1.4.0 LTS 的匹配固件版本的信息。有关 MLNX_OFED 版本过渡的信息,请参阅 适配器软件 中的 MLNX_OFED 部分。
DGX-1, DGX-2
ConnectX-4 (CX-4) 或
ConnectX-5 (CX-5)
|
DGX A100
ConnectX-6
|
DGX A100
ConnectX-7
|
DGX H100/H200
ConnectX-7
|
---|---|---|---|
CX-5: 16.35.4030 CX-4: 12.28.2006 |
有关安装说明,请参阅
NVIDIA MLNX_OFED: 安装 Mellanox OpenFabrics Enterprise Distribution (MLNX_OFED)
ConnectX®-7 适配器卡:安装 ConnectX-7 固件
ConnectX®-6 适配器卡:固件下载
注意
有关相关网络组件的 LTS 软件版本的信息,请参阅 网络长期支持版本 页面。
支持的 DGX 系统#
DGX OS 5 支持以下系统
DGX-1 32 GB
DGX-2
DGX A100 320 GB
DGX A100 640 GB
DGX A800 640 GB(需要 DGX OS 5.5 或更高版本)
DGX Station A100 160 GB
DGX Station A100 320 GB
DGX Station A800 320 GB
最新版本#
DGX OS 5.6.0#
发布日期:2024 年 5 月 1 日
此版本引入了以下新功能和更新
DGX OS ISO 5.6.0 已发布。
添加了一个选项,可以在从 DGX OS 5.x 版本升级到 DGX 6.x 版本期间保留 Mellanox OFED。
支持 MLNX_OFED LTS 版本 23.10-2.1.3.1。
对存储库进行了以下更改
OS 基础:Ubuntu 20.04.6 LTS
内核:5.4.0-176-generic
NVIDIA GPU 驱动程序:535.161.08
CUDA 工具包:12.2.2
MLNX_OFED: 23.10-2.1.3.1
NCCL: 2.20.3
cuDNN: 8.9.7
DCGM: 3.3.5
GPUDirect Storage: 1.7.2
NVSM: 23.09.02
Docker-CE: 24.0.7-1
NVIDIA Container Toolkit: 1.14.6-1
MIG 配置工具:0.5.5
NGC CLI: 3.36.0
DLFW: 24.01
GDRCopy: 2.4.1
以前的版本#
DGX OS 5.5#
以下是 DGX OS 5.5 中的新功能
注意
您的 DGX 合同使您有权获得 Ubuntu 存储库中其他软件包的扩展安全维护更新。请联系 NVIDIA 企业支持 以获取您的密钥来启用此功能。有关更多详细信息,请参阅 启用扩展安全维护升级。
增加了对 DGX A800 和 DGX Station A800 系统的支持。
对 Ubuntu 存储库进行了以下更改
NVIDIA GPU 驱动程序
R515: 515.105.01
R470: 470.182.03
R450: 450.236.01
对 NVIDIA 存储库进行了以下更改
DCGM: 2.4.8
NVSM: 22.09.08
NGC CLI: 3.17.0
DGX OS ISO 5.5.0 已发布。
DGX OS 5.4#
以下是 DGX OS 5.4 中的新功能。
添加了 GPUDirect Storage 1.0
升级的软件包
NVSM 升级到 22.06.02
DCGM 升级到 2.4.7
MLNX OFED 升级到 5.4-3.7.5.0
docker-ce: 20.10.18
nvidia-mig-parted
现在包含一组检查点/恢复命令。这些命令允许用户检查点(并在以后恢复)应用于节点上所有 GPU 的 MIG 配置,无论使用何种工具来设置这些 MIG 配置。
在以前版本的 nvidia-mig-parted
中,所有 MIG 配置都必须通过 nvidia- mig-parted
本身完成,以便它能够识别并随后重新配置一组 GPU 上的 MIG 状态。借助此新的检查点/恢复功能,也可以使用 nvidia-smi
等工具来配置 MIG。
以下示例对 GPU 进行分区,然后保存并恢复检查点。
对 GPU 进行分区
sudo nvidia-smi mig -C -cgi 1g.5gb,1g.5gb,1g.5gb,1g.5gb,1g.5gb,1g.5gb,1g.5gb
保存 GPU 分区的检查点
sudo -E nvidia-mig-parted checkpoint
这会将当前 MIG 状态的检查点保存到默认位置
/var/lib/nvidia-mig-manager/checkpoint.json
。稍后(例如,在重新启动系统之后),用户可以运行
restore
以确保正确恢复检查点 MIG 配置sudo -E nvidia-mig-parted restore
DGX OS 5.3#
以下是 DGX OS 5.3 中的新功能。另请参阅 更新:2022 年 11 月 22 日,了解自发布以来的重要更改。
警告
DGX OS 5.3 中的功能和组件版本与 DGX OS 5.2 中的版本相同。在 DGX OS 5.3 中,用于对这些存储库中的软件包和元数据进行签名的 GPG 密钥需要轮换。
有关更多信息,请参阅 轮换 GPG 密钥。
DGX OS 5.2#
以下是 DGX OS 5.2 中的新功能
NVSM 更新到 21.09.14
DCGM 更新到 2.3.2
添加了 DGX 软件堆栈安装方法
DGX 软件堆栈提供了安装 Ubuntu 20.04 原始版本,然后单独安装附加的 NVIDIA 软件(NVIDIA DGX 软件堆栈)的选项。此选项适用于 DGX 服务器(DGX A100、DGX-2、DGX-1)。DGX 软件堆栈是集成到 DGX OS ISO 映像中的软件堆栈的精简版本,并包含元软件包以简化安装过程。请参阅 在 Ubuntu 上安装。
DGX OS 5.1#
以下是 DGX OS 5.3 中的新功能。另请参阅 更新:2022 年 11 月 22 日,了解自发布以来的重要更改。
添加了 NVIDIA GPU 驱动程序版本 470。
注意
升级 DGX OS 时,系统将保留在已安装的 GPU 驱动程序分支上。例如,系统上的 GPU 驱动程序分支不会自动从 R450 切换到 R470。有关切换 GPU 驱动程序分支的说明,请参阅 DGX OS 用户指南的“更改 GPU 分支”部分。
本机支持高达 11.4 的 CUDA 工具包,或通过兼容性模块支持更新的版本。
将 Docker Engine 更新到 20.10。
整合了 NVIDIA MLNX_OFED 5.4。
更新了 NVSM
添加了生成测试警报/电子邮件的功能。
NVSM 转储/显示运行状况包括固件版本信息(在命令中整合了 ‘nvsm show -level all’)。
NVSM 将端口 273 绑定到 127.0.0.1 以限制外部通信。要为 IPV4 或 IPV6 打开其他端口,请编辑 nvsm.config (bindaddress),然后重新启动 NVSM
添加了 NVML 库
包括 MOFED 5.4
添加了 NGC CLI
添加了 MIG 配置工具,用于定义 MIG 分区并提供 systemd 服务,以使 MIG 分区在重启后保持持久性。
默认情况下禁用 MIG
MIG 配置文件会覆盖任何与 MIG 相关的
nvidia-smi
命令。对于 MIG 配置,请使用nvidia-mig-parted
而不是nvidia-smi
。arp_ignore=1
和arp_announce=2
现在在所有 InfiniBand 配置的接口上设置。添加了 LLDPd 以验证网络布线。默认配置现在设置为使用接口名称的 PortID 而不是 MAC 地址。
添加了对 GPUDirect Storage 1.0 的支持(有关安装说明,请参阅 GDS 文档)
警告
此版本整合了以下更新。
NVIDIA MLNX_OFED 5.4
建议客户考虑这些更新及其可能对其应用程序产生的任何影响。例如,某些依赖 MOFED 的应用程序可能会受到影响。
最佳实践是在选定的系统上进行升级,并在部署到更多系统之前验证您的应用程序是否按预期工作。
DGX OS 5.0#
这是 DGX OS 5 的初始版本。以下是 DGX OS 5 中的新功能
NVIDIA GPU 驱动程序版本 450。
本机支持高达 11.0 的 CUDA 工具包,或通过兼容性模块支持更新的版本。
整合了 NVIDIA MLNX_OFED 5.1。
添加了 rootfs 加密选项,可在重置映像过程中配置。
添加了密码保护 GRUB 菜单的选项,可在首次启动过程中配置。
更新了 NVSM
添加了对自定义驱动器分区的支持
添加了固件运行状况监控
更新了默认的 InfiniBand 网络命名策略。
在以前的版本中枚举为 ibx 的 InfinBand 接口,现在枚举为 ibpxsy(类似于以太网 (enpxsy))。有关新命名,请参阅 DGX A100 用户指南。
警告
此版本整合了以下更新。
NVIDIA MLNX_OFED 5.1
建议客户考虑这些更新及其可能对其应用程序产生的任何影响。例如,某些依赖 MOFED 的应用程序可能会受到影响。
最佳实践是在选定的系统上进行升级,并在部署到更多系统之前验证您的应用程序是否按预期工作。
更新历史#
本节提供有关 DGX OS 5 更新的信息。列出的更新包括
存储库中的主要组件更新。
存储库中的 NVIDIA 驱动程序更新
DGX OS 5.6.0 版本:2024 年 5 月 1 日#
DGX OS 5.6.0 已发布。
更新:2023 年 10 月 17 日#
添加了一个选项,可以在从 DGX OS 5.x 版本升级到 DGX 6.x 版本期间保留 Mellanox OFED。
对存储库进行了以下更改
R535 NVIDIA GPU 驱动程序:535.104.05
R525 NVIDIA GPU 驱动程序:525.125.06
R470 NVIDIA GPU 驱动程序:470.199.02
CUDA 工具包:12.2
NCCL: 2.18.3
Mellanox OFED: 5.4-3.7.5.0
NVSM: 23.06.04
Docker CE: 23.0.4
NVIDIA Container Toolkit: 1.14.0
MIG 配置工具:0.5.1
DLFW: 22.06
DGX OS 5.5 版本:2023 年 4 月#
DGX OS 5.5 已发布。
更新:2022 年 11 月 22 日#
对存储库进行了以下更改
R515 NVIDIA GPU 驱动程序:515.86.01
R470 NVIDIA GPU 驱动程序:470.161.03
R450 NVIDIA GPU 驱动程序:450.216.04
更新:2022 年 10 月 14 日#
对存储库进行了以下更改
添加了 GPUDirect Storage 1.0。
对 Ubuntu 存储库进行了以下更改
R470 NVIDIA GPU 驱动程序:470.129.06
R450 NVIDIA GPU 驱动程序:450.203.03
NCCL 2.15.1
DCGM 2.4.7
MOFED 5.4-3.5.8.0
NVSM 22.06.02
Docker-ce 20.10.18
MIG 配置工具:0.4.3
DGX OS ISO 5.4.1 已发布。
DGX OS 5.4 版本:2022 年 8 月 8 日#
DGX OS 5.4 已发布。
更新:2022 年 6 月 7 日#
安装程序版本已更新至 5.3.1。
对存储库进行了以下更改
R470 NVIDIA GPU 驱动程序:470.129.06
R450 NVIDIA GPU 驱动程序:450.191.01
DCGM: 2.3.6
NVSM: 22.03.05
Docker CE: 20.10.16
nvidia-peer-memory/nvidia-peer-memory DKMS: 1.3.0
DGX OS ISO 5.3.1 已发布。
更新:2022 年 5 月 17 日#
对存储库进行了以下更改
NVIDIA GPU R470 驱动程序:470.129.06
NVIDIA GPU R450 驱动程序:450.191.01
DGX OS 5.3 版本:2022 年 4 月 28 日#
DGX OS 5.3 已发布。
DGX OS 5.2 版本:2022 年 2 月 17 日#
DGX OS 5.2 已发布。
安装程序版本已更新至 5.2.0。
添加了 DGX 软件堆栈安装方法
DGX 软件堆栈提供了安装 Ubuntu 20.04 原始版本,然后单独安装附加的 NVIDIA 软件(NVIDIA DGX 软件堆栈)的选项。此选项适用于 DGX 服务器(DGX A100、DGX-2、DGX-1)。DGX 软件堆栈是集成到 DGX OS ISO 映像中的软件堆栈的精简版本,并包含元软件包以简化安装过程。请参阅 在 Ubuntu 上安装,以获取说明。
对 Ubuntu 存储库进行了以下更改
R470 NVIDIA GPU 驱动程序:470.103.01
R450 NVIDIA GPU 驱动程序:470.172.01
对 NVIDIA 存储库进行了以下更改
DCGM: 2.3.2
NVSM: 21.09.14
Docker CE: 20.10.11
nvidia-peer-memory/nvidia-peer-memory DKMS: 1.3.0
DGX OS ISO 5.2.0 已发布。
更新:2021 年 12 月 14 日#
安装程序版本已更新至 5.1.1。
对 Ubuntu 存储库进行了以下更改
R470 NVIDIA GPU 驱动程序:470.82.01
对 NVIDIA 存储库进行了以下更改
DCGM: 2.3.1
NVSM: 21.09.10
MOFED: MLNX 5.4-3.1.0.0
Docker CE: 20.10.11
nvidia-container 堆栈
nvidia-docker2-2.8.0-1
nvidia-container-runtime-3.7.0-1
nvidia-container-toolkit-1.7.0-1
libnvidia-container-tools-1.7.0-1
libnvidia-container1-1.7.0-1
nvipmitool: 1.0.6.0
nvidia-peer-memory/nvidia-peer-memory DKMS: 1.2.0
更新:2021 年 10 月 26 日#
对 Ubuntu 存储库进行了以下更改
NVIDIA GPU 驱动程序:450.156.00
DGX OS 5.1 版本:2021 年 8 月 26 日#
对 NVIDIA 存储库进行了以下更新
Docker Engine: 20.10.7
NVSM: 21.07.15
DCGM: 2.2.9
nvidia-container-runtime: 3.5.0-1
NVIDIA MLNX_OFED: 5.4-1.0.3.0
(新)NGC CLI: 2.2.0
(新)MIG 配置工具:0.1.2-1
对 Ubuntu 存储库进行了以下更改
添加了版本 470 GPU 驱动程序:470.57.02
DGX OS ISO 5.1.0 已发布。
更新:2021 年 6 月 30 日#
对 NVIDIA 存储库进行了以下更改
GPUDirect Storage: 添加了对 GPUDirect Storage (GDS) 的支持。它需要手动安装。有关更多信息和安装说明,请参阅 安装 GPUDirect Storage。
用于 GPUDirect Storage 的 NVSM:仅在安装 GPUDirect Storage 时更新至 21.03.11
用于 GPUDirectStorage 的 MOFED:仅在安装 GPUDirect Storage 时更新至 5.3-1.0.5.0。
更新:2021 年 6 月 20 日#
对 Ubuntu 存储库进行了以下更改
NVIDIA GPU 驱动程序:450.142.00
更新:2021 年 6 月 2 日#
对 Ubuntu 存储库进行了以下更改
NVIDIA GPU 驱动程序:450.119.04 这些是签名驱动程序,取代了未签名驱动程序。
更新:2021 年 5 月 27 日#
对 NVIDIA 存储库进行了以下更改
NVSM: 20.09.26
MOFED: MLNX 5.1-2.6.2.0
整合了 mlnx-fw-updater 5.2-1.0.4.0。进行更新时,Mellanox FW 更新程序会更新 ConnectX 卡固件,如下所示
卡
固件版本
ConnectX-4
12.28.2006
ConnectX-5
16.29.1016
ConnectX-6
20.29.1016
注意
ConnectX-4 中的固件可能已升级到更高版本。有关更多信息和强制降级版本的说明,请参阅 降级 ConnectX 固件。
更新:2021 年 5 月 06 日#
在 NVIDIA 存储库中进行了以下更改
NVIDIA GPU 驱动程序:450.119.04
未签名的预编译 450.119.04 内核模块已添加到 NVIDIA 存储库中,这提供了针对问题 报告的驱动程序版本不匹配 的修复程序。一旦 Canonical 提供了签名的预编译 450.119.04 内核模块,它们将被删除。
警告
如果您的系统启用了安全启动,请勿更新。由于这些是未签名驱动程序,因此启用安全启动的系统将无法加载驱动程序。
更新:2021 年 4 月 20 日#
在 Ubuntu 存储库中进行了以下更改
NVIDIA GPU 驱动程序:450.119.03 请参阅已知问题 报告的驱动程序版本不匹配。
更新:2021 年 4 月 13 日#
在 NVIDIA 存储库中进行了以下更改
GPUDirect Storage: 添加了对 GPUDirect Storage 的技术预览版支持。GPUDirect Storage 需要手动安装。有关更多信息和安装说明,请参阅 GDS 故障排除。
MOFED: 更新至 MLNX 5.1-2.6.2.0
注意
不再需要手动卸载以前的 MOFED 版本即可获取此更新。
更新:2021 年 3 月 30 日#
在 NVIDIA 存储库中进行了以下更改
MOFED: MLNX 5.1-2.5.8.0.47
警告
如果您已更新到最新的 Ubuntu 内核(
uname -a
报告 5.4.0-67 或更高版本),则需要卸载 MOFED,然后按如下方式重新安装。apt-get purge mlnx-ofed-all mlnx-ofed-kernel-dkms --auto-remove
apt-get update
apt-get install mlnx-ofed-all nvidia-peer-memory-dkms
更新:2021 年 3 月 2 日#
添加了对 DGX Station A100 的支持。
在 NVIDIA 存储库中进行了以下更改
DCGM: 2.0.14
NVSM: 20.09.20
DGX OS ISO 5.0.2 已发布。
更新:2021 年 2 月 23 日#
在 NVIDIA 存储库中进行了以下更改
NVSM: 20.09.17
更新:2021 年 1 月 20 日#
在 Ubuntu 存储库中进行了以下更改
NVIDIA GPU 驱动程序:450.102.04
更新:2020 年 12 月 11 日#
在 NVIDIA 存储库中进行了以下更改
Docker: docker-ce 19.03.14 这解决了 CVE-2020-15257
MOFED: MLNX 5.1-2.5.8.0 进行更新时,Mellanox FW 更新程序会更新 ConnectX 卡固件,如下所示
卡
固件版本
ConnectX-4
12.28.2006
ConnectX-5
16.28.4000
ConnectX-6
20.28.4000
注意
ConnectX-4 中的固件可能已升级到更高版本。有关更多信息和强制降级版本的说明,请参阅 降级 ConnectX 固件。
更新:2020 年 10 月 31 日(DGX OS 5.0 版本)#
DGX OS ISO 5.0.0 已发布。
DGX OS ISO 版本#
本节列出了所有 DGX OS ISO 版本以及映像中包含的软件版本。
DGX OS ISO 5.6.0#
组件 |
版本 |
注释 |
---|---|---|
Ubuntu |
基础操作系统 5.6.0 |
|
Ubuntu 内核 |
||
GPU 驱动程序 |
DGX OS ISO 中包含的默认驱动程序版本为 535.161.08。 |
|
CUDA 工具包 |
CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,以获取驱动程序兼容性信息。 |
|
MLNX_OFED |
||
NCCL |
||
cuDNN |
||
DCGM |
||
GPUDirect Storage (GDS) |
1.7.2 |
|
NVIDIA Container Toolkit |
NVIDIA Container Toolkit 包括以下软件包
|
|
nvidia-peer-memory nvidia-peer-memory-dkms |
1.3.0 |
|
NVSM |
||
Docker-CE |
请参阅 Docker Engine。 |
|
MIG 配置工具 |
0.5.5 |
|
GDRCopy |
||
NGC CLI |
3.36.0 |
请参阅 NGC CLI 文档。 |
DLFW |
24.01 |
|
ISO |
DGXOS-5.6.0-2024-04-16-06-58-50.iso |
请参阅 获取 DGX OS ISO 映像。 |
MD5 校验和 |
|
DGX OS ISO 5.5.0#
组件 |
版本 |
附加信息 |
---|---|---|
Ubuntu |
||
Ubuntu 内核 |
||
GPU 驱动程序 |
||
CUDA 工具包 |
注意:CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,以获取驱动程序兼容性信息。 |
|
NCCL |
||
cuDNN |
||
DCGM |
||
Mellanox OFED |
||
MLNX FW |
ConnectX-4: 12.28.2006 ConnectX-5: 16.31.2006 ConnectX-6: 20.31.2354 ConnectX-7: 28.34.4000 |
|
GPUDirect Storage (GDS) |
||
NVSM |
||
Docker Engine |
请参阅 Docker Engine。 |
|
NVIDIA Container Toolkit |
NVIDIA Container Toolkit 包括以下软件包:* libnvidia-container-tools: 1.12.0-1 * libnvidia-container1: 1.12.0-1 * nvidia-container-toolkit: 1.12.0-1 * nvidia-docker2: 2.11.0 |
|
MIG 配置工具 |
0.4.3 |
|
NGC CLI |
3.17.0 |
请参阅 NGC CLI 文档。 |
nvipmitool |
1.0.6.0 |
|
nvidia-peer-memory nvidia-peer-memory-dkms |
1.3.0 |
|
ISO 文件名 |
DGXOS-5.5.0-2023-03-27-13-31-04.iso |
请参阅 获取 DGX OS ISO 映像。 |
MD5 校验和 |
|
DGX OS ISO 5.4.1#
组件 |
版本 |
附加信息 |
---|---|---|
Ubuntu |
||
Ubuntu 内核 |
||
GPU 驱动程序 |
||
CUDA 工具包 |
注意:CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,以获取驱动程序兼容性信息。 |
|
NCCL |
||
cuDNN |
||
DCGM |
||
Mellanox OFED |
||
MLNX FW |
ConnectX-4: 12.28.2006 ConnectX-5: 16.31.2006 ConnectX-6: 20.31.2354 ConnectX-7: 28.34.4000 |
|
GPUDirect Storage (GDS) |
||
NVSM |
||
Docker Engine |
请参阅 Docker Engine。 |
|
NVIDIA Container Toolkit |
NVIDIA Container Toolkit 包括以下软件包:* libnvidia-container-tools: 1.12.0-1 * libnvidia-container1: 1.12.0-1 * nvidia-container-toolkit: 1.12.0-1 * nvidia-docker2: 2.11.0 |
|
MIG 配置工具 |
0.4.3 |
|
NGC CLI |
2.2.0-1 |
请参阅 NGC CLI 文档。 |
nvipmitool |
1.0.6.0 |
|
nvidia-peer-memory nvidia-peer-memory-dkms |
1.3.0 |
DGX OS ISO 5.3.1#
组件 |
版本 |
附加信息 |
---|---|---|
Ubuntu |
||
Ubuntu 内核 |
||
GPU 驱动程序 |
||
CUDA 工具包 |
注意:CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,以获取驱动程序兼容性信息。 |
|
DCGM |
||
Mellanox OFED |
||
NVSM |
||
Docker Engine |
请参阅 Docker Engine。 |
|
NVIDIA Container Toolkit |
NVIDIA Container Toolkit 包括以下软件包
|
|
MIG 配置工具 |
0.1.2-1 |
|
NGC CLI |
2.2.0-1 |
请参阅 NGC CLI 文档。 |
nvipmitool |
1.0.6.0 |
|
nvidia-peer-memory nvidia-peer-memory-dkms |
1.3.0 |
DGX OS ISO 5.2.0#
组件 |
版本 |
附加信息 |
---|---|---|
Ubuntu |
||
Ubuntu 内核 |
||
GPU 驱动程序 |
||
CUDA 工具包 |
注意:CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,以获取驱动程序兼容性信息。 |
|
DCGM |
||
Mellanox OFED |
||
MLNX FW |
ConnectX-4: 12.28.2006 ConnectX-5: 16.31.2006 ConnectX-6: 20.31.2354 ConnectX-7: 28.34.4000 |
|
NVSM |
||
Docker Engine |
请参阅 Docker Engine。 |
|
NVIDIA Container Toolkit |
NVIDIA Container Toolkit 包括以下软件包
|
|
MIG 配置工具 |
0.1.2-1 |
|
NGC CLI |
2.2.0-1 |
请参阅 NGC CLI 文档。 |
nvipmitool |
1.0.6.0 |
|
nvidia-peer-memory nvidia-peer-memory-dkms |
1.3.0 |
DGX OS ISO 5.1.0#
组件 |
版本 |
附加信息 |
---|---|---|
Ubuntu |
||
Ubuntu 内核 |
||
GPU 驱动程序 |
||
CUDA 工具包 |
注意:CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,以获取驱动程序兼容性信息。 |
|
DCGM |
||
Mellanox OFED |
||
NVSM |
||
Docker Engine |
请参阅 Docker Engine。 |
|
NVIDIA Container Toolkit |
NVIDIA Container Toolkit 包括以下软件包
|
|
MIG 配置工具 |
0.1.2-1 |
|
NGC CLI |
2.2.0-1 |
请参阅 NGC CLI 文档。 |
DGX OS ISO 5.0.2#
组件 |
版本 |
附加信息 |
---|---|---|
Ubuntu |
||
Ubuntu 内核 |
||
GPU 驱动程序 |
||
CUDA 工具包 |
注意:CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,以获取驱动程序兼容性信息。 |
|
DCGM |
||
Mellanox OFED |
||
NVSM |
||
Docker Engine |
请参阅 Docker Engine。 |
|
NVIDIA Container Toolkit |
NVIDIA Container Toolkit 包括以下软件包
|
DGX OS ISO 5.0.0#
组件 |
版本 |
附加信息 |
---|---|---|
Ubuntu |
||
Ubuntu 内核 |
||
GPU 驱动程序 |
||
CUDA 工具包 |
注意:CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,以获取驱动程序兼容性信息。 |
|
DCGM |
||
Mellanox OFED |
||
NVSM |
||
Docker Engine |
请参阅 Docker Engine。 |
|
NVIDIA Container Toolkit |
NVIDIA Container Toolkit 包括以下软件包
|