发行说明#

注意

软件升级是累积性的,这意味着您的系统将始终接收所有已安装软件组件的最新版本。存储库中的软件包也可能比当前 DGX OS 版本更新。请阅读并评估所有相关版本和后续升级中的信息和建议。

当前软件版本#

下表显示了 NVIDIA 和 Ubuntu 存储库中为 NVIDIA DGX 软件堆栈提供的软件包的当前版本信息。

当前软件版本(上次更新于 2024 年 12 月 9 日)#

组件

版本

附加信息

GPU 驱动程序

550.127.08

GPU 驱动程序

535.216.03

CUDA 工具包

12.4 更新 1

R550: 12.4 更新 1 下载

CUDA 工具包

12.2 更新 2

R535: 12.2 更新 2 下载

MLNX_OFED

24.10-1.1.4.0 LTS

24.10-1.1.4.0 下载

DOCA OFED

2.9.1

2.9.1 下载

内置 OFED

39.0-1

仅适用于 DGX OS 6。

NCCL

2.23.4

cuDNN

9.6.0

DCGM

3.3.9

GPUDirect Storage (GDS)

  • 1.11.1 适用于 CUDA 工具包 12.6 更新 2

  • 1.11 适用于 CUDA 工具包 12.6

  • 1.10 适用于 CUDA 工具包 12.5

  • 1.9 适用于 CUDA 工具包 12.4

  • 1.8 适用于 CUDA 工具包 12.3

  • 1.7 适用于 CUDA 工具包 12.2

NVIDIA 容器工具包

1.16.2

NVIDIA 容器工具包包含以下软件包

  • nvidia-container-toolkit: 1.16.2

  • libnvidia-container-tools: 1.16.2

  • libnvidia-container1: 1.16.2

nvidia-peer-memory

1.3

注意

  • CUDA 工具包默认仅为 DGX 工作站安装,对于 DGX 服务器是可选的。有关驱动程序兼容性信息,请参阅 CUDA 发行说明

  • 有关 CUDA 工具包次要版本兼容性和最低要求的驱动程序版本,请参阅 CUDA 兼容性

下表提供了关于 NVIDIA DOCA™ Host 软件包与 doca-ofed 安装配置文件 v2.9.1 以及 NVIDIA® OpenFabrics Enterprise Distribution for Linux (MLNX_OFED) v24.10-1.1.4.0 LTS 的匹配固件版本的信息。有关 MLNX_OFED 版本过渡的信息,请参阅 适配器软件 中的 MLNX_OFED 部分。

匹配的固件版本(上次更新于 2024 年 12 月 9 日)#
DGX-1, DGX-2
ConnectX-4 (CX-4) 或
ConnectX-5 (CX-5)
DGX A100
ConnectX-6
DGX A100
ConnectX-7
DGX H100/H200
ConnectX-7

CX-5: 16.35.4030

CX-4: 12.28.2006

20.43.2026

28.43.2026

28.43.2026

有关安装说明,请参阅

除了升级到本节中描述的版本外,执行软件包升级还可以更新软件组件版本、Ubuntu 22.04 LTS 版本和 Ubuntu 内核,具体取决于您执行升级的时间。

注意

有关相关网络组件的 LTS 软件版本的信息,请参阅 网络长期支持版本 页面。

重要提示

此版本包含以下更新

  • Ubuntu ConnectX 驱动程序和 OFED 堆栈。

  • 建议客户考虑这些更新及其可能对其应用程序产生的任何影响。例如,某些依赖 MOFED 的应用程序可能会受到影响。

  • 最佳实践支持升级选定的系统,并在部署到其他系统之前验证您的应用程序是否按预期工作。

支持的 DGX 系统#

DGX OS 6 支持以下系统

  • DGX H200(需要 DGX OS ISO 6.3.1)

  • DGX H100(需要 DGX OS ISO 6.0.11 或更高版本)

  • DGX H800(需要 DGX OS ISO 6.1.0 或更高版本)

  • DGX A100 640 GB

  • DGX A100 320 GB

  • DGX A800 640 GB

  • DGX Station A100 320 GB

  • DGX Station A100 160 GB

  • DGX Station A800 320 GB

  • DGX-2

  • DGX-1 (V100)

  • DGX Station (V100)

最新版本#

DGX OS 6.3.1(2024 年 9 月 17 日)#

此版本引入了以下新功能和更新

以前的版本#

本节提供有关 DGX OS 6 重要更新的信息。

DGX OS 6.3.0(2024 年 8 月 9 日)#

此版本引入了以下新功能和更新

DGX OS 6.2.1(2024 年 5 月 2 日)#

此版本引入了以下新功能和更新

DGX OS 6.2.0(2024 年 3 月 22 日)#

此版本引入了以下新功能和更新

  • DGX OS ISO 6.2.0 已发布。

  • 增加了对 DGX A100 系统的单端口 ConnectX-7 VPI 适配器卡的支持。

  • 支持 MLNX_OFED LTS 版本 23.10-2.1.3.1

  • 继续支持 DGX H100 和 DGX H800。

  • 以下更改已应用于存储库和 ISO

    • 操作系统基础: 22.04.3 LTS

    • 内核: 5.15.0-1046-nvidia

    • NVIDIA GPU 驱动程序: 535.161.07

    • CUDA 工具包: 12.2-1

    • NCCL: 2.20.3

    • cuDNN: 8.9.7

    • DCGM: 3.3.5

    • GPUDirect Storage: 1.7.2

    • NVSM: 23.12.01

    • Docker Engine: 24.0.7-1

    • NVIDIA 容器工具包: 1.14.6

    • MIG 配置工具: 0.5.5

    • NGC CLI: 3.36.0

    • DLFW: 24.01

    • GDRCopy: 2.4.1

DGX OS 6.1.0(2023 年 8 月 11 日)#

  • DGX OS ISO 6.1.0 已发布。

  • 以下更改已应用于存储库和 ISO

    • 增加了对 DGX H800 的支持。

    • 内核更新至 5.15.0-1029-nvidia。

    • gdrcopy 软件包已从 ISO 中移除,但仍可从存储库中获取。

    • gdrcopy 软件包可以作为选项安装,但不再默认安装。

    • dgx-h100-ota-update-meta 软件包已更新至 23.07.1。

    • nvidia-manage-ofed 软件包已更新至 23.07-1。

    • NVSM 已更新至 23.06.2。

    • NVIDIA CUDA 工具包已更新至 12.2.0。

    • NVIDIA 容器工具包已更新至 1.13.5。

DGX OS 6.0.11(2023 年 5 月 17 日)#

  • 增加了对 DGX H100 的支持

  • DGX OS ISO 6.0.11 已发布。

  • 以下更改已应用于存储库和 ISO

    • 内核版本更新至 5.15.0-1025.25

    • NVSM 更新至 22.12.06

DGX OS 6.0.10(2023 年 5 月 3 日)#

DGX OS ISO 版本#

本节列出了所有 DGX OS ISO 版本以及映像中包含的软件版本。

DGX OS ISO 6.3.1#

组件

版本

注释

Ubuntu

Ubuntu 22.04.4

基础操作系统 6.3.1

Ubuntu 内核

5.15.0-1063-nvidia

GPU 驱动程序

550.90.07

CUDA 工具包

12.4 更新 1

CUDA 工具包默认仅为 DGX 工作站安装,对于 DGX 服务器是可选的。有关驱动程序兼容性信息,请参阅 CUDA 发行说明

内置 OFED

39.0-1

NCCL

2.22.3

cuDNN

9.3.0

DCGM

3.3.8

GPUDirect Storage (GDS)

  • 1.9 适用于 CUDA 12.4

  • 1.7 适用于 CUDA 12.2 更新 2

NVIDIA 容器工具包

1.16.1-1

NVIDIA 容器工具包包含以下软件包

  • libnvidia-container-tools: 1.16.1-1

  • libnvidia-container1: 1.16.1-1

  • nvidia-container-toolkit: 1.16.1-1

NVSM

24.06.02

Docker Engine

27.1.2-1

GDRCopy

2.4.1

MIG 配置工具

0.9.1-1

请参阅 NVIDIA mig-parted github 页面部署

DLFW

24.07

ISO

DGXOS-6.3.1-2024-09-06-11-34-41.iso

MD5 校验和

795ec27bf05da792fc9cd7091475467c

DGX OS ISO 6.3.0#

组件

版本

注释

Ubuntu

Ubuntu 22.04.4

基础操作系统 6.3.0

Ubuntu 内核

5.15.0-1061-nvidia

GPU 驱动程序

CUDA 工具包

CUDA 工具包默认仅为 DGX 工作站安装,对于 DGX 服务器是可选的。有关驱动程序兼容性信息,请参阅 CUDA 发行说明

内置 OFED

39.0-1

NCCL

2.22.3

cuDNN

9.2.1

DCGM

3.3.7

GPUDirect Storage (GDS)

  • 1.9 适用于 CUDA 12.4

  • 1.7.2 适用于 CUDA 12.2 更新 2

  • 1.0 适用于 CUDA 11.4

NVIDIA 容器工具包

1.16.1

NVIDIA 容器工具包包含以下软件包

  • libnvidia-container-tools: 1.16.1

  • libnvidia-container1: 1.16.1

  • nvidia-container-toolkit: 1.16.1

NVSM

24.06.01

Docker Engine

26.1.4

GDRCopy

2.4.1

MIG 配置工具

0.8.0

请参阅 NVIDIA mig-parted github 页面部署

DLFW (BM)

24.06

ISO

DGXOS-6.3.0-2024-07-31-06-39-06.iso

MD5 校验和

d0f8cbc8691c217486b38160672da51e

DGX OS ISO 6.2.1#

组件

版本

注释

Ubuntu

Ubuntu 22.04.4

基础操作系统 6.2.1

Ubuntu 内核

5.15.0-1053-nvidia

GPU 驱动程序

535.161.08

CUDA 工具包

CUDA 工具包 12.2.2

CUDA 工具包默认仅为 DGX 工作站安装,对于 DGX 服务器是可选的。有关驱动程序兼容性信息,请参阅 CUDA 发行说明

内置 OFED

39.0-1

NCCL

2.20.3

cuDNN

8.9.7

DCGM

3.3.5

GPUDirect Storage (GDS)

1.7.2

NVIDIA 容器工具包

1.14.6-1

NVIDIA 容器工具包包含以下软件包

  • libnvidia-container-tools: 1.14.6-1

  • libnvidia-container1: 1.14.6-1

  • nvidia-container-toolkit: 1.14.6-1

NVSM

23.12.01

Docker Engine

24.0.7-1

GDRCopy

2.4.1

MIG 配置工具

0.5.5

NGC CLI

3.36.0

DLFW (BM)

24.01

ISO

DGXOS-6.2.1-2024-04-22-11-45-46.iso

MD5 校验和

ece1d02f34e9739f8c5538303b82630f

DGX OS ISO 6.2.0#

组件

版本

注释

Ubuntu

Ubuntu 22.04.3 LTS

基础操作系统 6.2.0

Ubuntu 内核

5.15.0-1046-nvidia

GPU 驱动程序

535.161.07

CUDA 工具包

CUDA 工具包 12.2.1

CUDA 工具包默认仅为 DGX 工作站安装,对于 DGX 服务器是可选的。有关驱动程序兼容性信息,请参阅 CUDA 发行说明

内置 OFED

39.0-1

NCCL

2.20.3

cuDNN

8.9.7

DCGM

3.3.5

GPUDirect Storage (GDS)

1.7.2

NVIDIA 容器工具包

1.14.6

NVIDIA 容器工具包包含以下软件包

  • libnvidia-container-tools: 1.14.6

  • libnvidia-container1: 1.14.6

  • nvidia-container-toolkit: 1.14.6

NVSM

23.12.01

Docker Engine

24.0.7-1

GDRCopy

2.4.1

MIG 配置工具

0.5.5

NGC CLI

3.36.0

DLFW (BM)

24.01

ISO

DGXOS-6.2.0-2024-03-15-14-25-26.iso

MD5 校验和

ecd6c5f77d957d41c8132a0d3941cf8c

DGX OS ISO 6.1.0#

组件

版本

附加信息

Ubuntu

22.04 LTS

优化的内核

5.15.0-1029-nvidia

GPU 驱动程序

R535: 535.54.03

CUDA 工具包

12.2.0

注意

CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,了解驱动程序兼容性信息。

NCCL

2.18.3

cuDNN

8.9.1

DCGM

3.1.8

内置 OFED

39.0-1

GPUDirect Storage (GDS)

2.15.1

NVSM

23.06.02

Docker Engine

23.0.4

请参阅 Docker Engine

NVIDIA 容器工具包

1.13.5

NVIDIA 容器工具包包含以下软件包

  • libnvidia-container-tools: 1.13.5-1

  • libnvidia-container1: 1.13.5-1

  • nvidia-container-toolkit: 1.13.5-1

MIG 配置工具

0.5.1

请参阅以下 NVIDIA mig-parted github 页面systemd

NGC CLI

3.17.0

请参阅 NGC CLI 文档

DLFW (BM)

23.06

ISO

DGXOS-6.1.0-2023-08-09-12-30-10.iso

MD5 校验和

d38620ffa58905330c1efe49b3d7ff53

DGX OS ISO 6.0.11#

组件

版本

附加信息

Ubuntu

22.04 LTS

优化的内核

5.15.0-1025.25

GPU 驱动程序

R525: 525.105.17

CUDA 工具包

12.0.1

注意

CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,了解驱动程序兼容性信息。

NCCL

2.17.1

cuDNN

8.9.0.131

DCGM

3.1.8

内置 OFED

39.0-1

GPUDirect Storage (GDS)

2.15.1

NVSM

22.12.06

Docker Engine

23.0.4

请参阅 Docker Engine

NVIDIA 容器工具包

1.13.1

NVIDIA 容器工具包包含以下软件包

  • libnvidia-container-tools: 1.13.1-1

  • libnvidia-container1: 1.13.1-1

  • nvidia-container-toolkit: 1.13.1-1

  • nvidia-docker2: 2.11.0

MIG 配置工具

0.5.1

请参阅以下 NVIDIA mig-parted github 页面systemd

NGC CLI

3.17.0

请参阅 NGC CLI 文档

DLFW (BM)

23.03

ISO

DGXOS-6.0.11-2023-05-16-16-18-31.iso

MD5 校验和

21d73f97b1e8d3efc15eddabb53c4f17

DGX OS ISO 6.0.10#

组件

版本

附加信息

Ubuntu

22.04 LTS

优化的内核

5.15.0-1023.23

GPU 驱动程序

R525: 525.105.17

CUDA 工具包

12.0.1

注意

CUDA 工具包仅为 DGX 工作站安装,对于 DGX 服务器是可选的。另请参阅最新的 CUDA 发行说明,了解驱动程序兼容性信息。

NCCL

2.17.1

cuDNN

8.9.0.131

DCGM

3.1.8

内置 OFED

39.0-1

GPUDirect Storage (GDS)

2.15.1

NVSM

22.12.04

Docker Engine

23.0.4

请参阅 Docker Engine

NVIDIA 容器工具包

1.13.1

NVIDIA 容器工具包包含以下软件包

  • libnvidia-container-tools: 1.13.1-1

  • libnvidia-container1: 1.13.1-1

  • nvidia-container-toolkit: 1.13.1-1

  • nvidia-docker2: 2.11.0

MIG 配置工具

0.5.1

请参阅以下 NVIDIA mig-parted github 页面systemd

NGC CLI

3.17.0

请参阅 NGC CLI 文档

DLFW (BM)

23.03

ISO

DGXOS-6.0.10-2023-05-02-19-06-32.iso

MD5 校验和

55ae2430a4ca490e0383f3740a39941e