发行说明#

本节提供 DGX OS 5 可用版本和升级的详细信息。

注意

软件升级是累积性的,这意味着您的系统将始终接收所有已安装软件组件的最新版本。存储库中的软件包也可能比当前的 DGX OS 版本更新。您应该评估来自所有相关版本和后续升级的信息和建议。

当前软件版本#

下表显示了 NVIDIA 和 Ubuntu 存储库中为 NVIDIA DGX 软件堆栈提供的软件包的当前版本信息。

当前软件版本(上次更新于 2024 年 12 月 9 日)#

组件

版本

附加信息

GPU 驱动程序

550.127.08

GPU 驱动程序

535.216.03

CUDA 工具包

12.4 Update 1

R550: 12.4 Update 1 下载

CUDA 工具包

12.2 Update 2

R535: 12.2 Update 2 下载

MLNX_OFED

24.10-1.1.4.0 LTS

24.10-1.1.4.0 下载

DOCA OFED

2.9.1

2.9.1 下载

Inbox OFED

39.0-1

仅适用于 DGX OS 6。

NCCL

2.23.4

cuDNN

9.6.0

DCGM

3.3.9

GPUDirect Storage (GDS)

  • CUDA Toolkit 12.6 Update 2 的 1.11.1

  • CUDA Toolkit 12.6 的 1.11

  • CUDA Toolkit 12.5 的 1.10

  • CUDA Toolkit 12.4 的 1.9

  • CUDA Toolkit 12.3 的 1.8

  • CUDA Toolkit 12.2 的 1.7

NVIDIA Container Toolkit

1.16.2

NVIDIA Container Toolkit 包括以下软件包

  • nvidia-container-toolkit: 1.16.2

  • libnvidia-container-tools: 1.16.2

  • libnvidia-container1: 1.16.2

nvidia-peer-memory

1.3

注意

  • 默认情况下,CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。有关驱动程序兼容性信息,请参阅 CUDA 发行说明

  • 有关 CUDA 工具包次要版本兼容性和最低要求的驱动程序版本,请参阅 CUDA 兼容性

下表提供了关于 NVIDIA DOCA™ Host 软件包与 doca-ofed 安装配置文件 v2.9.1 和 NVIDIA® OpenFabrics Enterprise Distribution for Linux (MLNX_OFED) v24.10-1.1.4.0 LTS 的匹配固件版本的信息。有关 MLNX_OFED 版本过渡的信息,请参阅 适配器软件 中的 MLNX_OFED 部分。

匹配的固件版本(上次更新于 2024 年 12 月 9 日)#
DGX-1, DGX-2
ConnectX-4 (CX-4) 或
ConnectX-5 (CX-5)
DGX A100
ConnectX-6
DGX A100
ConnectX-7
DGX H100/H200
ConnectX-7

CX-5: 16.35.4030

CX-4: 12.28.2006

20.43.2026

28.43.2026

28.43.2026

有关安装说明,请参阅

注意

有关相关网络组件的 LTS 软件版本的信息,请参阅 网络长期支持版本 页面。

支持的 DGX 系统#

DGX OS 5 支持以下系统

  • DGX-1 32 GB

  • DGX-2

  • DGX A100 320 GB

  • DGX A100 640 GB

  • DGX A800 640 GB(需要 DGX OS 5.5 或更高版本)

  • DGX Station A100 160 GB

  • DGX Station A100 320 GB

  • DGX Station A800 320 GB

最新版本#

DGX OS 5.6.0#

发布日期:2024 年 5 月 1 日

此版本引入了以下新功能和更新

  • DGX OS ISO 5.6.0 已发布。

  • 添加了一个选项,可以在从 DGX OS 5.x 版本升级到 DGX 6.x 版本期间保留 Mellanox OFED。

  • 支持 MLNX_OFED LTS 版本 23.10-2.1.3.1

  • 对存储库进行了以下更改

    • OS 基础:Ubuntu 20.04.6 LTS

    • 内核:5.4.0-176-generic

    • NVIDIA GPU 驱动程序:535.161.08

    • CUDA 工具包:12.2.2

    • MLNX_OFED: 23.10-2.1.3.1

    • NCCL: 2.20.3

    • cuDNN: 8.9.7

    • DCGM: 3.3.5

    • GPUDirect Storage: 1.7.2

    • NVSM: 23.09.02

    • Docker-CE: 24.0.7-1

    • NVIDIA Container Toolkit: 1.14.6-1

    • MIG 配置工具:0.5.5

    • NGC CLI: 3.36.0

    • DLFW: 24.01

    • GDRCopy: 2.4.1

以前的版本#

DGX OS 5.5#

以下是 DGX OS 5.5 中的新功能

  • 注意

    您的 DGX 合同使您有权获得 Ubuntu 存储库中其他软件包的扩展安全维护更新。请联系 NVIDIA 企业支持 以获取您的密钥来启用此功能。有关更多详细信息,请参阅 启用扩展安全维护升级

  • 增加了对 DGX A800 和 DGX Station A800 系统的支持。

  • 对 Ubuntu 存储库进行了以下更改

    • NVIDIA GPU 驱动程序

      • R515: 515.105.01

      • R470: 470.182.03

      • R450: 450.236.01

    • 对 NVIDIA 存储库进行了以下更改

      • DCGM: 2.4.8

      • NVSM: 22.09.08

      • NGC CLI: 3.17.0

  • DGX OS ISO 5.5.0 已发布。

DGX OS 5.4#

以下是 DGX OS 5.4 中的新功能。

  • 添加了 GPUDirect Storage 1.0

  • 升级的软件包

    • NVSM 升级到 22.06.02

    • DCGM 升级到 2.4.7

    • MLNX OFED 升级到 5.4-3.7.5.0

    • docker-ce: 20.10.18

nvidia-mig-parted 现在包含一组检查点/恢复命令。这些命令允许用户检查点(并在以后恢复)应用于节点上所有 GPU 的 MIG 配置,无论使用何种工具来设置这些 MIG 配置。

在以前版本的 nvidia-mig-parted 中,所有 MIG 配置都必须通过 nvidia- mig-parted 本身完成,以便它能够识别并随后重新配置一组 GPU 上的 MIG 状态。借助此新的检查点/恢复功能,也可以使用 nvidia-smi 等工具来配置 MIG。

以下示例对 GPU 进行分区,然后保存并恢复检查点。

  • 对 GPU 进行分区

    sudo nvidia-smi mig -C -cgi 1g.5gb,1g.5gb,1g.5gb,1g.5gb,1g.5gb,1g.5gb,1g.5gb
    
  • 保存 GPU 分区的检查点

    sudo -E nvidia-mig-parted checkpoint
    

    这会将当前 MIG 状态的检查点保存到默认位置 /var/lib/nvidia-mig-manager/checkpoint.json

  • 稍后(例如,在重新启动系统之后),用户可以运行 restore 以确保正确恢复检查点 MIG 配置

    sudo -E nvidia-mig-parted restore
    

DGX OS 5.3#

以下是 DGX OS 5.3 中的新功能。另请参阅 更新:2022 年 11 月 22 日,了解自发布以来的重要更改。

警告

DGX OS 5.3 中的功能和组件版本与 DGX OS 5.2 中的版本相同。在 DGX OS 5.3 中,用于对这些存储库中的软件包和元数据进行签名的 GPG 密钥需要轮换。

有关更多信息,请参阅 轮换 GPG 密钥

DGX OS 5.2#

以下是 DGX OS 5.2 中的新功能

  • NVSM 更新到 21.09.14

  • DCGM 更新到 2.3.2

  • 添加了 DGX 软件堆栈安装方法

DGX 软件堆栈提供了安装 Ubuntu 20.04 原始版本,然后单独安装附加的 NVIDIA 软件(NVIDIA DGX 软件堆栈)的选项。此选项适用于 DGX 服务器(DGX A100、DGX-2、DGX-1)。DGX 软件堆栈是集成到 DGX OS ISO 映像中的软件堆栈的精简版本,并包含元软件包以简化安装过程。请参阅 在 Ubuntu 上安装

DGX OS 5.1#

以下是 DGX OS 5.3 中的新功能。另请参阅 更新:2022 年 11 月 22 日,了解自发布以来的重要更改。

  • 添加了 NVIDIA GPU 驱动程序版本 470。

    注意

    升级 DGX OS 时,系统将保留在已安装的 GPU 驱动程序分支上。例如,系统上的 GPU 驱动程序分支不会自动从 R450 切换到 R470。有关切换 GPU 驱动程序分支的说明,请参阅 DGX OS 用户指南的“更改 GPU 分支”部分。

  • 本机支持高达 11.4 的 CUDA 工具包,或通过兼容性模块支持更新的版本。

  • 将 Docker Engine 更新到 20.10。

  • 整合了 NVIDIA MLNX_OFED 5.4。

  • 更新了 NVSM

  • 添加了生成测试警报/电子邮件的功能。

  • NVSM 转储/显示运行状况包括固件版本信息(在命令中整合了 ‘nvsm show -level all’)。

  • NVSM 将端口 273 绑定到 127.0.0.1 以限制外部通信。要为 IPV4 或 IPV6 打开其他端口,请编辑 nvsm.config (bindaddress),然后重新启动 NVSM

  • 添加了 NVML 库

  • 包括 MOFED 5.4

  • 添加了 NGC CLI

  • 添加了 MIG 配置工具,用于定义 MIG 分区并提供 systemd 服务,以使 MIG 分区在重启后保持持久性。

  • 默认情况下禁用 MIG

  • MIG 配置文件会覆盖任何与 MIG 相关的 nvidia-smi 命令。对于 MIG 配置,请使用 nvidia-mig-parted 而不是 nvidia-smi

  • arp_ignore=1arp_announce=2 现在在所有 InfiniBand 配置的接口上设置。

  • 添加了 LLDPd 以验证网络布线。默认配置现在设置为使用接口名称的 PortID 而不是 MAC 地址。

  • 添加了对 GPUDirect Storage 1.0 的支持(有关安装说明,请参阅 GDS 文档

警告

此版本整合了以下更新。

  • NVIDIA MLNX_OFED 5.4

建议客户考虑这些更新及其可能对其应用程序产生的任何影响。例如,某些依赖 MOFED 的应用程序可能会受到影响。

最佳实践是在选定的系统上进行升级,并在部署到更多系统之前验证您的应用程序是否按预期工作。

DGX OS 5.0#

这是 DGX OS 5 的初始版本。以下是 DGX OS 5 中的新功能

  • NVIDIA GPU 驱动程序版本 450。

  • 本机支持高达 11.0 的 CUDA 工具包,或通过兼容性模块支持更新的版本。

  • 整合了 NVIDIA MLNX_OFED 5.1。

  • 添加了 rootfs 加密选项,可在重置映像过程中配置。

  • 添加了密码保护 GRUB 菜单的选项,可在首次启动过程中配置。

  • 更新了 NVSM

  • 添加了对自定义驱动器分区的支持

  • 添加了固件运行状况监控

  • 更新了默认的 InfiniBand 网络命名策略。

在以前的版本中枚举为 ibx 的 InfinBand 接口,现在枚举为 ibpxsy(类似于以太网 (enpxsy))。有关新命名,请参阅 DGX A100 用户指南。

警告

此版本整合了以下更新。

  • NVIDIA MLNX_OFED 5.1

建议客户考虑这些更新及其可能对其应用程序产生的任何影响。例如,某些依赖 MOFED 的应用程序可能会受到影响。

最佳实践是在选定的系统上进行升级,并在部署到更多系统之前验证您的应用程序是否按预期工作。

更新历史#

本节提供有关 DGX OS 5 更新的信息。列出的更新包括

  • 存储库中的主要组件更新。

  • 存储库中的 NVIDIA 驱动程序更新

DGX OS 5.6.0 版本:2024 年 5 月 1 日#

更新:2023 年 10 月 17 日#

  • 添加了一个选项,可以在从 DGX OS 5.x 版本升级到 DGX 6.x 版本期间保留 Mellanox OFED。

  • 对存储库进行了以下更改

    • R535 NVIDIA GPU 驱动程序:535.104.05

    • R525 NVIDIA GPU 驱动程序:525.125.06

    • R470 NVIDIA GPU 驱动程序:470.199.02

    • CUDA 工具包:12.2

    • NCCL: 2.18.3

    • Mellanox OFED: 5.4-3.7.5.0

    • NVSM: 23.06.04

    • Docker CE: 23.0.4

    • NVIDIA Container Toolkit: 1.14.0

    • MIG 配置工具:0.5.1

    • DLFW: 22.06

DGX OS 5.5 版本:2023 年 4 月#

更新:2022 年 11 月 22 日#

  • 对存储库进行了以下更改

    • R515 NVIDIA GPU 驱动程序:515.86.01

    • R470 NVIDIA GPU 驱动程序:470.161.03

    • R450 NVIDIA GPU 驱动程序:450.216.04

更新:2022 年 10 月 14 日#

  • 对存储库进行了以下更改

    • 添加了 GPUDirect Storage 1.0。

    • 对 Ubuntu 存储库进行了以下更改

    • R470 NVIDIA GPU 驱动程序:470.129.06

    • R450 NVIDIA GPU 驱动程序:450.203.03

    • NCCL 2.15.1

    • DCGM 2.4.7

    • MOFED 5.4-3.5.8.0

    • NVSM 22.06.02

    • Docker-ce 20.10.18

    • MIG 配置工具:0.4.3

  • DGX OS ISO 5.4.1 已发布。

DGX OS 5.4 版本:2022 年 8 月 8 日#

更新:2022 年 6 月 7 日#

  • 安装程序版本已更新至 5.3.1。

  • 对存储库进行了以下更改

    • R470 NVIDIA GPU 驱动程序:470.129.06

    • R450 NVIDIA GPU 驱动程序:450.191.01

    • DCGM: 2.3.6

    • NVSM: 22.03.05

    • Docker CE: 20.10.16

    • nvidia-peer-memory/nvidia-peer-memory DKMS: 1.3.0

  • DGX OS ISO 5.3.1 已发布。

更新:2022 年 5 月 17 日#

  • 对存储库进行了以下更改

    • NVIDIA GPU R470 驱动程序:470.129.06

    • NVIDIA GPU R450 驱动程序:450.191.01

DGX OS 5.3 版本:2022 年 4 月 28 日#

DGX OS 5.2 版本:2022 年 2 月 17 日#

  • DGX OS 5.2 已发布。

  • 安装程序版本已更新至 5.2.0。

  • 添加了 DGX 软件堆栈安装方法

    DGX 软件堆栈提供了安装 Ubuntu 20.04 原始版本,然后单独安装附加的 NVIDIA 软件(NVIDIA DGX 软件堆栈)的选项。此选项适用于 DGX 服务器(DGX A100、DGX-2、DGX-1)。DGX 软件堆栈是集成到 DGX OS ISO 映像中的软件堆栈的精简版本,并包含元软件包以简化安装过程。请参阅 在 Ubuntu 上安装,以获取说明。

  • 对 Ubuntu 存储库进行了以下更改

    • R470 NVIDIA GPU 驱动程序:470.103.01

    • R450 NVIDIA GPU 驱动程序:470.172.01

  • 对 NVIDIA 存储库进行了以下更改

    • DCGM: 2.3.2

    • NVSM: 21.09.14

    • Docker CE: 20.10.11

    • nvidia-peer-memory/nvidia-peer-memory DKMS: 1.3.0

  • DGX OS ISO 5.2.0 已发布。

更新:2021 年 12 月 14 日#

  • 安装程序版本已更新至 5.1.1。

  • 对 Ubuntu 存储库进行了以下更改

    • R470 NVIDIA GPU 驱动程序:470.82.01

  • 对 NVIDIA 存储库进行了以下更改

    • DCGM: 2.3.1

    • NVSM: 21.09.10

    • MOFED: MLNX 5.4-3.1.0.0

    • Docker CE: 20.10.11

    • nvidia-container 堆栈

      • nvidia-docker2-2.8.0-1

      • nvidia-container-runtime-3.7.0-1

      • nvidia-container-toolkit-1.7.0-1

      • libnvidia-container-tools-1.7.0-1

      • libnvidia-container1-1.7.0-1

    • nvipmitool: 1.0.6.0

    • nvidia-peer-memory/nvidia-peer-memory DKMS: 1.2.0

更新:2021 年 10 月 26 日#

  • 对 Ubuntu 存储库进行了以下更改

    • NVIDIA GPU 驱动程序:450.156.00

DGX OS 5.1 版本:2021 年 8 月 26 日#

  • 对 NVIDIA 存储库进行了以下更新

    • Docker Engine: 20.10.7

    • NVSM: 21.07.15

    • DCGM: 2.2.9

    • nvidia-container-runtime: 3.5.0-1

    • NVIDIA MLNX_OFED: 5.4-1.0.3.0

    • (新)NGC CLI: 2.2.0

    • (新)MIG 配置工具:0.1.2-1

  • 对 Ubuntu 存储库进行了以下更改

    • 添加了版本 470 GPU 驱动程序:470.57.02

  • DGX OS ISO 5.1.0 已发布。

更新:2021 年 6 月 30 日#

  • 对 NVIDIA 存储库进行了以下更改

    • GPUDirect Storage: 添加了对 GPUDirect Storage (GDS) 的支持。它需要手动安装。有关更多信息和安装说明,请参阅 安装 GPUDirect Storage

    • 用于 GPUDirect Storage 的 NVSM:仅在安装 GPUDirect Storage 时更新至 21.03.11

    • 用于 GPUDirectStorage 的 MOFED:仅在安装 GPUDirect Storage 时更新至 5.3-1.0.5.0。

更新:2021 年 6 月 20 日#

  • 对 Ubuntu 存储库进行了以下更改

    • NVIDIA GPU 驱动程序:450.142.00

更新:2021 年 6 月 2 日#

  • 对 Ubuntu 存储库进行了以下更改

    • NVIDIA GPU 驱动程序:450.119.04 这些是签名驱动程序,取代了未签名驱动程序。

更新:2021 年 5 月 27 日#

  • 对 NVIDIA 存储库进行了以下更改

    • NVSM: 20.09.26

    • MOFED: MLNX 5.1-2.6.2.0

      整合了 mlnx-fw-updater 5.2-1.0.4.0。进行更新时,Mellanox FW 更新程序会更新 ConnectX 卡固件,如下所示

      固件版本

      ConnectX-4

      12.28.2006

      ConnectX-5

      16.29.1016

      ConnectX-6

      20.29.1016

      注意

      ConnectX-4 中的固件可能已升级到更高版本。有关更多信息和强制降级版本的说明,请参阅 降级 ConnectX 固件

更新:2021 年 5 月 06 日#

  • 在 NVIDIA 存储库中进行了以下更改

    • NVIDIA GPU 驱动程序:450.119.04

      未签名的预编译 450.119.04 内核模块已添加到 NVIDIA 存储库中,这提供了针对问题 报告的驱动程序版本不匹配 的修复程序。一旦 Canonical 提供了签名的预编译 450.119.04 内核模块,它们将被删除。

      警告

      如果您的系统启用了安全启动,请勿更新。由于这些是未签名驱动程序,因此启用安全启动的系统将无法加载驱动程序。

更新:2021 年 4 月 20 日#

更新:2021 年 4 月 13 日#

  • 在 NVIDIA 存储库中进行了以下更改

    • GPUDirect Storage: 添加了对 GPUDirect Storage 的技术预览版支持。GPUDirect Storage 需要手动安装。有关更多信息和安装说明,请参阅 GDS 故障排除

    • MOFED: 更新至 MLNX 5.1-2.6.2.0

      注意

      不再需要手动卸载以前的 MOFED 版本即可获取此更新。

更新:2021 年 3 月 30 日#

  • 在 NVIDIA 存储库中进行了以下更改

    • MOFED: MLNX 5.1-2.5.8.0.47

      警告

      如果您已更新到最新的 Ubuntu 内核(uname -a 报告 5.4.0-67 或更高版本),则需要卸载 MOFED,然后按如下方式重新安装。

      apt-get purge mlnx-ofed-all mlnx-ofed-kernel-dkms --auto-remove
      
      apt-get update
      
      apt-get install mlnx-ofed-all nvidia-peer-memory-dkms
      

更新:2021 年 3 月 2 日#

  • 添加了对 DGX Station A100 的支持。

  • 在 NVIDIA 存储库中进行了以下更改

    • DCGM: 2.0.14

    • NVSM: 20.09.20

  • DGX OS ISO 5.0.2 已发布。

更新:2021 年 2 月 23 日#

  • 在 NVIDIA 存储库中进行了以下更改

    • NVSM: 20.09.17

更新:2021 年 1 月 20 日#

  • 在 Ubuntu 存储库中进行了以下更改

    • NVIDIA GPU 驱动程序:450.102.04

更新:2020 年 12 月 11 日#

  • 在 NVIDIA 存储库中进行了以下更改

    • Docker: docker-ce 19.03.14 这解决了 CVE-2020-15257

    • MOFED: MLNX 5.1-2.5.8.0 进行更新时,Mellanox FW 更新程序会更新 ConnectX 卡固件,如下所示

      固件版本

      ConnectX-4

      12.28.2006

      ConnectX-5

      16.28.4000

      ConnectX-6

      20.28.4000

      注意

      ConnectX-4 中的固件可能已升级到更高版本。有关更多信息和强制降级版本的说明,请参阅 降级 ConnectX 固件

更新:2020 年 10 月 31 日(DGX OS 5.0 版本)#

DGX OS ISO 版本#

本节列出了所有 DGX OS ISO 版本以及映像中包含的软件版本。

DGX OS ISO 5.6.0#

组件

版本

注释

Ubuntu

Ubuntu 20.04.6 LTS

基础操作系统 5.6.0

Ubuntu 内核

5.4.0-176-generic

GPU 驱动程序

535.161.08

DGX OS ISO 中包含的默认驱动程序版本为 535.161.08。

CUDA 工具包

12.2.2

CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,以获取驱动程序兼容性信息。

MLNX_OFED

23.10-2.1.3.1

NCCL

2.20.3

cuDNN

8.9.7

DCGM

3.3.5

GPUDirect Storage (GDS)

1.7.2

NVIDIA Container Toolkit

1.14.6-1

NVIDIA Container Toolkit 包括以下软件包

  • nvidia-container-toolkit: 1.14.6-1

  • libnvidia-container-tools: 1.14.6-1

  • libnvidia-container1: 1.14.6-1

nvidia-peer-memory

nvidia-peer-memory-dkms

1.3.0

NVSM

23.09.02

Docker-CE

24.0.7-1

请参阅 Docker Engine

MIG 配置工具

0.5.5

请参阅 GitHub 上的 NVIDIA mig-parted 项目

GDRCopy

2.4.1

NGC CLI

3.36.0

请参阅 NGC CLI 文档

DLFW

24.01

ISO

DGXOS-5.6.0-2024-04-16-06-58-50.iso

请参阅 获取 DGX OS ISO 映像

MD5 校验和

c37f00223d02b8694ef190bdeb5fc9f6

DGX OS ISO 5.5.0#

组件

版本

附加信息

Ubuntu

20.04 LTS

Ubuntu 内核

5.4.0-144.161

GPU 驱动程序

470.182.03

CUDA 工具包

11.4.4

注意:CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,以获取驱动程序兼容性信息。

NCCL

2.15.1

cuDNN

8.4.1

DCGM

2.4.8

Mellanox OFED

5.4-3.5.8.0

MLNX FW

ConnectX-4: 12.28.2006

ConnectX-5: 16.31.2006

ConnectX-6: 20.31.2354

ConnectX-7: 28.34.4000

GPUDirect Storage (GDS)

1.0

NVSM

22.09.08

Docker Engine

23.0.0-1

请参阅 Docker Engine

NVIDIA Container Toolkit

1.12.0

NVIDIA Container Toolkit 包括以下软件包:* libnvidia-container-tools: 1.12.0-1 * libnvidia-container1: 1.12.0-1 * nvidia-container-toolkit: 1.12.0-1 * nvidia-docker2: 2.11.0

MIG 配置工具

0.4.3

请参阅 GitHub 中的 NVIDIA mig-parted 项目

NGC CLI

3.17.0

请参阅 NGC CLI 文档

nvipmitool

1.0.6.0

nvidia-peer-memory

nvidia-peer-memory-dkms

1.3.0

ISO 文件名

DGXOS-5.5.0-2023-03-27-13-31-04.iso

请参阅 获取 DGX OS ISO 映像

MD5 校验和

d65d6a39e2f6c1fdac87e57bd7493fde

DGX OS ISO 5.4.1#

组件

版本

附加信息

Ubuntu

20.04 LTS

Ubuntu 内核

5.4.0-52.57

GPU 驱动程序

470.129.06

CUDA 工具包

11.4.4

注意:CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,以获取驱动程序兼容性信息。

NCCL

2.15.1

cuDNN

8.4.1

DCGM

2.4.7

Mellanox OFED

5.4-3.5.8.0

MLNX FW

ConnectX-4: 12.28.2006

ConnectX-5: 16.31.2006

ConnectX-6: 20.31.2354

ConnectX-7: 28.34.4000

GPUDirect Storage (GDS)

1.0

NVSM

22.09.07

Docker Engine

23.0

请参阅 Docker Engine

NVIDIA Container Toolkit

1.12.0

NVIDIA Container Toolkit 包括以下软件包:* libnvidia-container-tools: 1.12.0-1 * libnvidia-container1: 1.12.0-1 * nvidia-container-toolkit: 1.12.0-1 * nvidia-docker2: 2.11.0

MIG 配置工具

0.4.3

请参阅 GitHub 中的 NVIDIA mig-parted 项目

NGC CLI

2.2.0-1

请参阅 NGC CLI 文档

nvipmitool

1.0.6.0

nvidia-peer-memory

nvidia-peer-memory-dkms

1.3.0

DGX OS ISO 5.3.1#

组件

版本

附加信息

Ubuntu

20.04 LTS

Ubuntu 内核

5.4.0-113.127

GPU 驱动程序

470.129.06

CUDA 工具包

11.4.2

注意:CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,以获取驱动程序兼容性信息。

DCGM

2.3.6

Mellanox OFED

5.4-3.1.0.0

NVSM

22.03.05

Docker Engine

20.10.16

请参阅 Docker Engine

NVIDIA Container Toolkit

1.7.0

NVIDIA Container Toolkit 包括以下软件包

  • libnvidia-container-tools: 1.7.0-1

  • libnvidia-container1: 1.7.0-1

  • nvidia-container-toolkit: 1.7.0-1

  • nvidia-container-runtime: 2.8.0-1

  • nvidia-docker2: 2.8.0-1

MIG 配置工具

0.1.2-1

请参阅 GitHub 中的 NVIDIA mig-parted 项目

NGC CLI

2.2.0-1

请参阅 NGC CLI 文档

nvipmitool

1.0.6.0

nvidia-peer-memory

nvidia-peer-memory-dkms

1.3.0

DGX OS ISO 5.2.0#

组件

版本

附加信息

Ubuntu

20.04 LTS

Ubuntu 内核

5.4.0-80.90

GPU 驱动程序

470.103.01

CUDA 工具包

11.4.4

注意:CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,以获取驱动程序兼容性信息。

DCGM

2.3.2

Mellanox OFED

5.4-1.0.3.0

MLNX FW

ConnectX-4: 12.28.2006

ConnectX-5: 16.31.2006

ConnectX-6: 20.31.2354

ConnectX-7: 28.34.4000

NVSM

21.09.14

Docker Engine

20.10.11

请参阅 Docker Engine

NVIDIA Container Toolkit

1.7.0

NVIDIA Container Toolkit 包括以下软件包

  • libnvidia-container-tools: 1.7.0-1

  • libnvidia-container1: 1.7.0-1

  • nvidia-container-toolkit: 1.7.0-1

  • nvidia-container-runtime: 3.5.0-1 FIXME 无法确定?

  • nvidia-docker2: 2.8.0

MIG 配置工具

0.1.2-1

请参阅 GitHub 中的 NVIDIA mig-parted 项目

NGC CLI

2.2.0-1

请参阅 NGC CLI 文档

nvipmitool

1.0.6.0

nvidia-peer-memory

nvidia-peer-memory-dkms

1.3.0

DGX OS ISO 5.1.0#

组件

版本

附加信息

Ubuntu

20.04 LTS

Ubuntu 内核

5.4.0-80.90

GPU 驱动程序

470.57.02

CUDA 工具包

11.4.0

注意:CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,以获取驱动程序兼容性信息。

DCGM

2.2.9

Mellanox OFED

5.4-1.0.3.0

NVSM

22.03.05

Docker Engine

20.10.7

请参阅 Docker Engine

NVIDIA Container Toolkit

1.5.1

NVIDIA Container Toolkit 包括以下软件包

  • libnvidia-container-tools: 1.5.1-1

  • libnvidia-container1: 1.4.0-1

  • nvidia-container-toolkit: 1.4.0-1

  • nvidia-container-runtime: 3.5.0-1

  • nvidia-docker2: 2.6.0-1

MIG 配置工具

0.1.2-1

请参阅 GitHub 中的 NVIDIA mig-parted 项目

NGC CLI

2.2.0-1

请参阅 NGC CLI 文档

DGX OS ISO 5.0.2#

组件

版本

附加信息

Ubuntu

20.04 LTS

Ubuntu 内核

5.4.0-58.127

GPU 驱动程序

450.80.02

CUDA 工具包

11.4.0

注意:CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,以获取驱动程序兼容性信息。

DCGM

2.0.14

Mellanox OFED

5.1-2.5.8.0

NVSM

20.09.17

Docker Engine

19.03.14

请参阅 Docker Engine

NVIDIA Container Toolkit

1.3.0

NVIDIA Container Toolkit 包括以下软件包

  • libnvidia-container-tools: 1.3.0-1

  • libnvidia-container1: 1.3.0-1

  • nvidia-container-toolkit: 1.3.0-1

  • nvidia-container-runtime: 3.4.0-1

  • nvidia-docker2: 2.5.0-1

DGX OS ISO 5.0.0#

组件

版本

附加信息

Ubuntu

20.04 LTS

Ubuntu 内核

5.4.0-52.127

GPU 驱动程序

450.80.02

CUDA 工具包

11.4.0

注意:CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,以获取驱动程序兼容性信息。

DCGM

2.0.13

Mellanox OFED

5.1-2.4.6.0

NVSM

20.07.40

Docker Engine

19.03.13

请参阅 Docker Engine

NVIDIA Container Toolkit

1.3.0

NVIDIA Container Toolkit 包括以下软件包

  • libnvidia-container-tools: 1.3.0-1

  • libnvidia-container1: 1.3.0-1

  • nvidia-container-toolkit: 1.3.0-1

  • nvidia-container-runtime: 3.4.0-1

  • nvidia-docker2: 2.5.0-1