DGX OS 4 桌面软件发行说明

面向 DGX Station 上 DGX OS 4 桌面的所有用户的发行信息。

NVIDIA DGX Station 的 DGX OS 4 桌面的当前状态、有关包含的软件以及已知问题的信息。

1. DGX OS 桌面 版本和版本控制

此信息帮助您了解 DGX OS 桌面 版本编号约定以及升级 DGX OS 桌面 软件的选项。

DGX OS 桌面 版本

DGX OS 是一种基于 Ubuntu Linux 的自定义 Linux 发行版。它包括特定于平台的配置、诊断和监控工具,以及在 DGX 系统上运行 AI、机器学习和分析应用程序所需的稳定、经过测试和支持的 OS 所需的驱动程序。

DGX OS 通常在每年 2 月和 8 月左右发布两次,在首次发布后的两年内发布。在发布之间以及此后的整个支持期间提供更新。

发行版本

DGX OS 发行版本编号约定为 MAJOR.MINOR,它定义了以下类型的发行版本

  • 主要版本通常基于 Ubuntu 发行版,其中包括新的内核版本和并非始终向后兼容的新功能。
    例如:
    • DGX OS 6.x 版本基于 Ubuntu 22.04
    • DGX OS 5.x 版本基于 Ubuntu 20.04
    • DGX OS 4.x 基于 Ubuntu 18.04
  • 次要版本主要包括新的 NVIDIA 功能以及累积的错误修复和安全更新。

    这些版本是增量的,始终包含之前的所有软件更改。

    • 在 DGX OS 4 及更早版本中,次要版本通常也与 NVIDIA Linux 图形驱动程序版本对齐。
    • 在 DGX OS 5 和 OS 6 中,您现在可以选择独立于 DGX OS 版本安装较新的 NVIDIA 图形驱动程序。

DGX OS 发行机制

本节提供有关可用于安装或升级到最新版本的 DGX OS 的 DGX OS 发行机制的信息。

ISO 映像

DGX OS 以 ISO 映像形式发布,其中包含必要的软件包和自主安装程序。ISO 映像的更新版本也会发布,这些更新版本

  • 提供错误修复和安全缓解措施。

  • 改善安装体验。

  • 提供硬件配置支持。

您应始终使用最新的 ISO 映像,除非您需要将系统还原到早期版本。

警告: 此映像允许您安装 DGX 系统或对 DGX 系统重新映像以将系统还原到默认状态,但此过程会擦除您应用于 OS 的所有更改。

Linux 软件存储库

DGX OS 的升级通过软件存储库提供。软件存储库是系统从中检索和安装 OS 更新和应用程序的存储位置。DGX OS 使用的存储库由 Canonical 托管,用于 Ubuntu OS,NVIDIA 托管用于 DGX 特定软件和其他 NVIDIA 软件。每个存储库都是旨在安装其他软件和更新 DGX 系统上的软件的软件包集合。

这些软件包的新版本包含错误修复和安全更新,从而提供 DGX OS 版本的更新。存储库也会更新以包含硬件启用,这可能会增加对新系统或新硬件组件(如网卡或磁盘驱动器)的支持。此更新不会影响现有硬件配置。

系统升级是累积的,这意味着您的系统将始终收到所有更新的软件组件的最新版本。您无法选择要进行的升级或将升级限制为非最新的 DGX OS 6.x 版本。

重要提示: 我们建议您不要更新单个组件。

更新系统之前,请参阅 DGX OS 软件发行说明,获取可用更新列表。有关显示可用更新和升级说明的更多信息,请参阅 DGX OS 6 用户指南

2. DGX OS 桌面 4 版本

2.1. 升级到 DGX OS 桌面 4 版本时配置文件冲突

在从早期版本升级到 DGX OS 桌面 4 版本期间,系统会提示您解决配置文件中的冲突。当出现提示时,请评估更改,然后再接受维护者的版本、保留本地版本或手动解决差异。

/etc/apt/sources.list.d/dgxstation.list 中的冲突出现的原因是升级过程编辑该文件以指定 bionic 存储库以进行未来更新。为避免丢失用户可能对此文件所做的任何自定义设置,请保留本地版本。

以下配置文件中的冲突是为 DGX OS 桌面 对 Ubuntu Desktop OS 进行自定义设置的结果

  • /etc/grub.d/10_linux。您可以接受软件包维护者的版本,因为不再需要自定义设置。
  • /etc/ssh/sshd_config。保留本地版本以保留自定义设置,这些自定义设置仍然需要。

2.2. 从 4.0 版本升级到 DGX OS 桌面 版本 4.13.0

执行此任务以从 DGX OS 桌面 4.0 版本(例如,4.0.4、4.0.5 或 4.0.6)升级到 DGX OS 桌面 版本 4.13.0DGX OS 桌面版本 4.13.0 包含来自更新发行分支的 NVIDIA 图形驱动程序和 NVIDIA CUDA Toolkit 软件,而不是 DGX OS 桌面 4.0 版本的发行分支。升级过程会更新您的软件包源,以从新版本的存储库中获取未来更新。

确保满足以下先决条件
  • 您已作为管理员用户登录到 DGX Station 上的 Ubuntu 桌面。
  • 您的 DGX Station 正在运行 DGX OS 桌面 4.0 版本,例如 4.0.4、4.0.5 或 4.0.6。
  1. 从所有配置的来源下载有关软件包最新版本的信息。
    $ sudo apt update
  2. 安装 dgxstation-bionic-r418+cuda10.1-repo 软件包。
    $ sudo apt install -y dgxstation-bionic-r418+cuda10.1-repo
    此步骤安装 R418 存储库。
  3. 可选:要移动到 R450 软件包,请在安装 R418 存储库后,发出以下命令:
    $ sudo apt install -y dgxstation-bionic-r450+cuda11.0-repo
    
  4. 安装 dgxstation-bionic-r418+cuda10.1-repo 软件包后,再次从所有配置的来源下载有关软件包最新版本的信息。
    $ sudo apt update
  5. 通过模拟软件包升级来查看可用更新。
    $ sudo apt -s full-upgrade
  6. 为您当前的 DGX OS 桌面版本安装所有可用更新。
    $ sudo apt -y full-upgrade

    注意: 即使启用了 R450 存储库,CUDA 11.0 也不会自动安装。要手动安装 CUDA 11.0,请发出以下命令

    $ sudo apt install -y cuda-toolkit-11-0
  7. 更新完成后,重新启动 DGX Station

    对 Linux 的 NVIDIA 图形驱动程序的任何更新都需要重新启动。

    如果您更新了 Linux 的 NVIDIA 图形驱动程序但未重新启动 DGX Station,则运行 nvidia-smi 命令会显示错误消息。

    $ nvidia-smi
    Failed to initialize NVML: Driver/library version mismatch
    
  8. 确认 Linux 的 NVIDIA 图形驱动程序和 NVIDIA CUDA Toolkit 软件版本。
    $ nvidia-smi
    Fri Mar 13 18:03:56 2020
    +------------------------------------------------------------------------+
    | NVIDIA-SMI  418.126.02 Driver Version: 418.126.02  CUDA Version: 10.1  |
    |-----------------------------+--------------------+---------------------+
    ...

2.3. DGX OS 桌面 软件更新的分发方法变更

为了快速交付安全更新和关键错误修复,NVIDIA 正在更改 DGX OS 桌面 软件更新的分发方式。

DGX OS 桌面 4.1.1 开始,除了现有的完整 DGX OS 桌面 版本之外,NVIDIA 还将引入 DGX OS 桌面 软件的补丁更新。

如果您不选择加入补丁更新,您将在下一个完整版本中获得这些更新,该版本汇总了自上一个完整版本以来的所有补丁更新中的更改。因此,您可以选择始终拥有最新的更新,或者通过仅在 NVIDIA 发布完整 DGX OS 桌面 版本时进行更新来降低系统软件更新的频率。

以前,所有 DGX OS 桌面 软件更新都是完整版本,所有用户都可以使用,无需选择加入。

有关完整 DGX OS 桌面 版本和补丁更新以及如何识别它们的更多信息,请参阅 DGX OS 桌面版本和版本控制

2.4. DGX OS 桌面 4 版本历史记录

2.4.1. DGX OS 桌面 4 更新

版本 4.14.0 中的更新

  • 新软件版本
    • Linux 内核:4.15.0-176
    • Linux 的 NVIDIA 图形驱动程序:450.203.03
    • cuDNN 库:8.4.1
    • NCCL:2.13.4
    • NVSM:20.09.40
    • DCGM:2.4.5
    • MLNX OFED:4.9-4.1.7.0
    • 适用于 Docker 的 NVIDIA 容器运行时: 3.7.0-1
    • Docker CE:20.10.17
注意

启动 DCGM 服务时,将出现类似于以下内容的版本不匹配错误消息

[78075.772392] nvidia-nvswitch: Version mismatch, kernel version 450.80.00 user version 450.51.06

这在使用 GPU 驱动程序版本高于 450.51.06 的情况下发生。版本检查发生在所有 DGX 系统上,但仅适用于 NVSwitch 系统,因此在 DGX Station/DGX-1 系统上可以忽略该消息。

版本 4.13.0 中的更新

  • 新软件版本
注意

启动 DCGM 服务时,将出现类似于以下内容的版本不匹配错误消息

[78075.772392] nvidia-nvswitch: Version mismatch, kernel version 450.80.00 user version 450.51.06

这在使用 GPU 驱动程序版本高于 450.51.06 的情况下发生。版本检查发生在所有 DGX 系统上,但仅适用于 NVSwitch 系统,因此在 DGX Station/DGX-1 系统上可以忽略该消息。

版本 4.11.0 中的更新

注意

启动 DCGM 服务时,将出现类似于以下内容的版本不匹配错误消息

[78075.772392] nvidia-nvswitch: Version mismatch, kernel version 450.80.00 user version 450.51.06

这在使用 GPU 驱动程序版本高于 450.51.06 的情况下发生。版本检查发生在所有 DGX 系统上,但仅适用于 NVSwitch 系统,因此在 DGX Station/DGX-1 系统上可以忽略该消息。

版本 4.9.0 中的更新

注意

启动 DCGM 服务时,将出现类似于以下内容的版本不匹配错误消息

[78075.772392] nvidia-nvswitch: Version mismatch, kernel version 450.80.00 user version 450.51.06

这在使用 GPU 驱动程序版本高于 450.51.06 的情况下发生。版本检查发生在所有 DGX 系统上,但仅适用于 NVSwitch 系统,因此在 DGX Station/DGX-1 系统上可以忽略该消息。

版本 4.8.0 中的更新

注意

启动 DCGM 服务时,将出现类似于以下内容的版本不匹配错误消息

[78075.772392] nvidia-nvswitch: Version mismatch, kernel version 450.80.00 user version 450.51.06

这在使用 GPU 驱动程序版本高于 450.51.06 的情况下发生。版本检查发生在所有 DGX 系统上,但仅适用于 NVSwitch 系统,因此在 DGX Station/DGX-1 系统上可以忽略该消息。

版本 4.7.0 中的更新

注意

启动 DCGM 服务时,将出现类似于以下内容的版本不匹配错误消息

[78075.772392] nvidia-nvswitch: Version mismatch, kernel version 450.80.00 user version 450.51.06

这在使用 GPU 驱动程序版本高于 450.51.06 的情况下发生。版本检查发生在所有 DGX 系统上,但仅适用于 NVSwitch 系统,因此在 DGX Station/DGX-1 系统上可以忽略该消息。

版本 4.6.0 中的更新

注意

启动 DCGM 服务时,将出现类似于以下内容的版本不匹配错误消息

[78075.772392] nvidia-nvswitch: Version mismatch, kernel version 450.80.00 user version 450.51.06

这在使用 GPU 驱动程序版本高于 450.51.06 的情况下发生。版本检查发生在所有 DGX 系统上,但仅适用于 NVSwitch 系统,因此在 DGX Station/DGX-1 系统上可以忽略该消息。

版本 4.5.0 中的更新

  • 新软件版本
  • 支持 DGX Station 上的 NVSM 命令 nvsm show healthnvsm dump health,这些命令取代了 nvhealthnvsysinfo 命令
  • 支持禁用和恢复 CPU 缓解措施

版本 4.4.0 中的更新

  • 新软件版本
  • 支持 DGX Station 上的 NVSM 命令 nvsm show healthnvsm dump health,这些命令取代了 nvhealthnvsysinfo 命令
  • 支持禁用和恢复 CPU 缓解措施

版本 4.3.0 中的更新

版本 4.2.0 中的更新

DGX OS 桌面 版本引入了自补丁更新 4.1.1 以来的新软件版本,并累积了先前通过补丁更新 4.1.1 分发的新软件版本。

  • 自补丁更新 4.1.1 以来的新软件版本
    • Ubuntu Desktop 操作系统 18.04.3
    • Linux 的 NVIDIA 图形驱动程序 418.87.01
    • 适用于 Docker 的 NVIDIA 容器运行时 3.1.1
    • Docker CE 19.03
  • 先前通过补丁更新 4.1.1 分发的新软件版本

补丁更新 4.1.1 中的更新

  • 新软件版本
    • Linux 的 NVIDIA 图形驱动程序 418.87.00
    • NVIDIA CUDA Toolkit 10.1.243
    • NVIDIA cuDNN 库 7.6.2
    • NCCL 2.4.7
    • 适用于 Docker 的 NVIDIA 容器运行时 3.0.0
    • Docker CE 18.09.8

版本 4.1.0 中的更新

  • 新软件版本

版本 4.0.7 中的更新

  • 新软件版本:Linux 的 NVIDIA 图形驱动程序 410.129

版本 4.0.6 中的更新

版本 4.0.5 中的更新

版本 4.0.4 中的更新

  • 新软件版本
    • Ubuntu Desktop 操作系统 18.04 LTS

      在 Ubuntu 18.04 中,GNOME 桌面环境取代了 Unity 桌面环境。有关 GNOME 桌面环境入门的帮助,请参阅 Ubuntu 18.04 官方文档中的 GNOME 简介

    • Linux 的 NVIDIA 图形驱动程序 410.79
    • NVIDIA CUDA Toolkit 10.0.130
    • NVIDIA cuDNN 库 7.3.1
    • NCCL 2.3.5-4
    • Docker CE 18.06.1
  • 引入 适用于 Docker 的 NVIDIA 容器运行时 以取代 适用于 NVIDIA GPU 的 Docker Engine 实用程序

2.4.3. DGX OS 桌面 4 废弃软件包

版本 4-14-0 中废弃的软件包

无。

版本 4-13-0 中废弃的软件包

无。

版本 4.12.0 中废弃的软件包

无。

版本 4.11.0 中废弃的软件包

无。

版本 4.10.0 中废弃的软件包

无。

版本 4.9.0 中废弃的软件包

无。

版本 4.8.0 中废弃的软件包

无。

版本 4.7.0 中废弃的软件包

无。

版本 4.6.0 中废弃的软件包

无。

版本 4.5.0 中废弃的软件包

无。

版本 4.4.0 中废弃的软件包

  • nvhealth
  • nvsysinfo

版本 4.3.0 中废弃的软件包

无。

版本 4.2.0 中废弃的软件包

无。

补丁更新 4.1.1 中废弃的软件包

libnvidia-diagnostic-418

版本 4.1.0 中废弃的软件包

无。

版本 4.0.7 中废弃的软件包

无。

版本 4.0.6 中废弃的软件包

无。

版本 4.0.5 中废弃的软件包

无。

版本 4.0.4 中废弃的软件包

nvidia-docker

注意: 由于更新到新版本的 Ubuntu Desktop 操作系统,Canonical 的许多软件包在此 DGX OS 桌面 版本中也被废弃。

2.5. DGX OS 桌面 4.14 版本

2.5.1. DGX OS 桌面 软件版本 4.14.0

DGX OS 桌面 版本 4.14.0 中的软件版本

注意: 如果您的系统运行的版本早于 DGX OS 4.12.0,则需要更新系统上的密钥。有关如何轮换密钥的更多信息,请参阅 轮换 GPG 密钥
软件 使用 R450 版本 附加信息
Ubuntu Desktop 操作系统

18.04

另请参阅注释 (2)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-176

另请参阅注释 (2)。

 
Linux 的 NVIDIA 图形驱动程序 450.203.03  
NVIDIA CUDA Toolkit 11.0.3 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 8.4.1 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.13.4 NVIDIA 深度学习 SDK 文档
NVIDIA 系统管理 (NVSM) 20.09.37 NVIDIA 系统管理文档
OpenGL 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

3.7.0-1

请参阅注释 (3)。

NVIDIA 深度学习框架文档
Docker CE

20.10.17

另请参阅注释 (4)。

注意
  1. 版本 4.14.0 的存储库更新目前正在进行中,截至 2022 年 8 月 23 日。

  2. DGX OS 桌面 4.14.0 已使用此版本进行测试。如果在您升级到 DGX OS 桌面 4.14.0 之前提供了对 Linux 内核的后续升级,则您的系统可能正在运行更高版本。
  3. 适用于 Docker 的 NVIDIA 容器运行时 取代了 适用于 NVIDIA GPU 的 Docker Engine 实用程序。在早期版本中,适用于 Docker 的 NVIDIA 容器运行时 作为可选升级提供,如 升级到适用于 Docker 的 NVIDIA 容器运行时 中所述。
  4. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。您的 DGX Station 上的 Docker CE 版本是当您通过网络更新 DGX OS 桌面 软件时从此 NVIDIA 存储库提供的版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 4.14.0 中的更新

  • 新软件版本
    • Linux 内核:4.15.0-176
    • Linux 的 NVIDIA 图形驱动程序:450.203.03
    • cuDNN 库:8.4.1
    • NCCL:2.13.4
    • NVSM:20.09.40
    • DCGM:2.4.5
    • MLNX OFED:4.9-4.1.7.0
    • 适用于 Docker 的 NVIDIA 容器运行时: 3.7.0-1
    • Docker CE:20.10.17
注意

启动 DCGM 服务时,将出现类似于以下内容的版本不匹配错误消息

[78075.772392] nvidia-nvswitch: Version mismatch, kernel version 450.80.00 user version 450.51.06

这在使用 GPU 驱动程序版本高于 450.51.06 的情况下发生。版本检查发生在所有 DGX 系统上,但仅适用于 NVSwitch 系统,因此在 DGX Station/DGX-1 系统上可以忽略该消息。

支持的升级路径

版本 4-14-0 中废弃的软件包

无。

2.6. DGX OS 桌面 4.13 版本

2.6.1. DGX OS 桌面 软件版本 4.13.0

DGX OS 桌面 版本 4.13.0 中的软件版本

注意: 如果您的系统运行的版本早于 DGX OS 4.12,则需要更新系统上的密钥。有关如何轮换密钥的更多信息,请参阅 轮换 GPG 密钥
软件 使用 R450 版本 附加信息
Ubuntu Desktop 操作系统

18.04

另请参阅注释 (1)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-176

另请参阅注释 (1)。

 
Linux 的 NVIDIA 图形驱动程序 450.191.01  
NVIDIA CUDA Toolkit 11.03 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 8.3.3 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.12.12 NVIDIA 深度学习 SDK 文档
NVIDIA 系统管理 (NVSM) 20.09.37 NVIDIA 系统管理文档
OpenGL 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

3.7.0-1

请参阅注释 (2)。

NVIDIA 深度学习框架文档
Docker CE

20.10.14

另请参阅注释 (3)。

注意
  1. DGX OS Desktop 4.13.0 已使用此版本进行测试。如果在您升级到 DGX OS Desktop 4.13.0 之前有后续的 Linux 内核升级可用,则您的系统可能正在运行更高版本。
  2. NVIDIA Container Runtime for Docker 取代了 用于 NVIDIA GPU 的 Docker 引擎实用程序。在早期版本中,NVIDIA Container Runtime for Docker 作为可选升级提供,如升级到 NVIDIA Container Runtime for Docker中所述。
  3. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。DGX Station 上的 Docker CE 版本是当您通过网络更新 DGX OS Desktop 软件时,可从 NVIDIA 存储库获得的发布版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 4.13.0 中的更新

  • 新软件版本
注意

启动 DCGM 服务时,将出现类似于以下内容的版本不匹配错误消息

[78075.772392] nvidia-nvswitch: Version mismatch, kernel version 450.80.00 user version 450.51.06

这在使用 GPU 驱动程序版本高于 450.51.06 的情况下发生。版本检查发生在所有 DGX 系统上,但仅适用于 NVSwitch 系统,因此在 DGX Station/DGX-1 系统上可以忽略该消息。

分发方法

支持的升级路径

版本 4-13-0 中废弃的软件包

无。

2.7. DGX OS Desktop 4.12 版本

2.7.1. DGX OS Desktop 软件版本 4.12.0

DGX OS Desktop 版本 4.12.0 中的软件版本

重要提示: 在 DGX OS 4.12 中,用于对这些存储库中的软件包和元数据进行签名的 GPG 密钥需要轮换。 有关详细信息,请参阅轮换 GPG 密钥

DGX OS 4.12.0 中的组件版本与 DGX OS 4.11.0 中的版本相同。

软件 使用 R450 版本 附加信息
Ubuntu Desktop 操作系统

18.04

另请参阅注释 (1)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-156-generic(或更高版本)

另请参阅注释 (1)。

 
Linux 的 NVIDIA 图形驱动程序 450.172.01  
NVIDIA CUDA Toolkit 11.0.3 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 8.3.2 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.11.4 NVIDIA 深度学习 SDK 文档
NVIDIA 系统管理 (NVSM) 20.09.35 NVIDIA 系统管理文档
OpenGL 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

3.7.0-1

另请参阅注释 (2)。

NVIDIA 深度学习框架文档
Docker CE

20.10.11

另请参阅注释 (3)。

注意
  1. DGX OS Desktop 4.12.0 已使用此版本进行测试。如果在您升级到 DGX OS Desktop 4.12.0 之前有后续的 Linux 内核升级可用,则您的系统可能正在运行更高版本。
  2. NVIDIA Container Runtime for Docker 取代了 用于 NVIDIA GPU 的 Docker 引擎实用程序。在早期版本中,NVIDIA Container Runtime for Docker 作为可选升级提供,如升级到 NVIDIA Container Runtime for Docker中所述。
  3. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。DGX Station 上的 Docker CE 版本是当您通过网络更新 DGX OS Desktop 软件时,可从 NVIDIA 存储库获得的发布版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce
注意

启动 DCGM 服务时,将出现类似于以下内容的版本不匹配错误消息

[78075.772392] nvidia-nvswitch: Version mismatch, kernel version 450.80.00 user version 450.51.06

这在使用 GPU 驱动程序版本高于 450.51.06 的情况下发生。版本检查发生在所有 DGX 系统上,但仅适用于 NVSwitch 系统,因此在 DGX Station/DGX-1 系统上可以忽略该消息。

支持的升级路径

版本 4.12.0 中废弃的软件包

无。

2.7.2. 轮换 GPG 密钥

NVIDIA 不断评估和改进安全实施。 作为这些改进的一部分,我们正在推出更改以加强存储库的安全性和可靠性。 这些更改需要轮换用于对这些存储库中的元数据和软件包进行签名的 GPG 密钥。 本节提供有关如何在系统上轮换 GPG 密钥的信息。

  1. 下载新的存储库设置软件包。
    $ wget https://international.download.nvidia.com/dgxstation/repos/bionic/pool/multiverse/d/dgxstation-repo/dgxstation-repo_1.0-5_amd64.deb
    $ wget https://international.download.nvidia.com/dgxstation/repos/bionic/pool/multiverse/n/nvidia-repo-keys/nvidia-repo-keys_22.04-1_all.deb 
  2. 直接安装 .deb 软件包,这将跳过在 apt 中执行的 GPG 检查。
    注意: 如果出现提示,请确保接受所有文件的维护者版本。
    $ $ sudo dpkg --force-confnew -i ./nvidia-repo-keys_22.04-1_all.deb  ./dgxstation-repo_1.0-5_amd64.deb
  3. 手动撤销之前的 DGX 和 CUDA GPG 密钥。
    $ sudo apt-key del 629C85F2
    $ sudo apt-key del 7FA2AF80
  4. 更新之前启用的可选存储库。
    for x in $(find /etc/apt/sources.list.d -name "dgx*.list"); do if ! grep -q "signed-by" $x; then sudo sed -i 's|^deb |deb [arch=amd64 signed-by=/usr/share/keyrings/dgx_debian_prod.gpg] |' $x; fi; done
OTA 更新现在可以正常进行。

2.8. DGX OS Desktop 4.11 版本

2.8.1. DGX OS Desktop 软件版本 4.11.0

DGX OS Desktop 版本 4.11.0 中的软件版本

软件 使用 R450 版本 附加信息
Ubuntu Desktop 操作系统

18.04

另请参阅注释 (1)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-156-generic(或更高版本)

另请参阅注释 (1)。

 
Linux 的 NVIDIA 图形驱动程序 450.172.01  
NVIDIA CUDA Toolkit 11.0.3 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 8.3.2 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.11.4 NVIDIA 深度学习 SDK 文档
NVIDIA 系统管理 (NVSM) 20.09.35 NVIDIA 系统管理文档
OpenGL 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

3.7.0-1

另请参阅注释 (2)。

NVIDIA 深度学习框架文档
Docker CE

20.10.11

另请参阅注释 (3)。

注意
  1. DGX OS Desktop 4.11.0 已使用此版本进行测试。如果在您升级到 DGX OS Desktop 4.11.0 之前有后续的 Linux 内核升级可用,则您的系统可能正在运行更高版本。
  2. NVIDIA Container Runtime for Docker 取代了 用于 NVIDIA GPU 的 Docker 引擎实用程序。在早期版本中,NVIDIA Container Runtime for Docker 作为可选升级提供,如升级到 NVIDIA Container Runtime for Docker中所述。
  3. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。DGX Station 上的 Docker CE 版本是当您通过网络更新 DGX OS Desktop 软件时,可从 NVIDIA 存储库获得的发布版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 4.11.0 中的更新

注意

启动 DCGM 服务时,将出现类似于以下内容的版本不匹配错误消息

[78075.772392] nvidia-nvswitch: Version mismatch, kernel version 450.80.00 user version 450.51.06

这在使用 GPU 驱动程序版本高于 450.51.06 的情况下发生。版本检查发生在所有 DGX 系统上,但仅适用于 NVSwitch 系统,因此在 DGX Station/DGX-1 系统上可以忽略该消息。

支持的升级路径

版本 4.11.0 中废弃的软件包

无。

2.9. DGX OS Desktop 4.10 版本

2.9.1. DGX OS Desktop 软件版本 4.10.0

DGX OS Desktop 版本 4.10.0 中的软件版本

软件 随 R418 版本发布 使用 R450 版本 附加信息
Ubuntu Desktop 操作系统

18.04

另请参阅注释 (1)。

18.04

另请参阅注释 (1)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-156-generic(或更高版本)

另请参阅注释 (1)。

4.15.0-156-generic(或更高版本)

另请参阅注释 (1)。

 
Linux 的 NVIDIA 图形驱动程序 418.226.00 450.156.00  
NVIDIA CUDA Toolkit 10.1 Update 2 11.0.3 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 8.0.5 8.2.2 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.8.3 2.11.4 NVIDIA 深度学习 SDK 文档
NVIDIA 系统管理 (NVSM) 20.03.6 20.09.34 NVIDIA 系统管理文档
OpenGL 4.6 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

3.5.0-1

另请参阅注释 (2)。

3.5.0-1

另请参阅注释 (2)。

NVIDIA 深度学习框架文档
Docker CE

20.10.8

另请参阅注释 (3)。

20.10.8

另请参阅注释 (3)。

注意
  1. DGX OS Desktop 4.10.0 已使用此版本进行测试。如果在您升级到 DGX OS Desktop 4.10.0 之前有后续的 Linux 内核升级可用,则您的系统可能正在运行更高版本。
  2. NVIDIA Container Runtime for Docker 取代了 用于 NVIDIA GPU 的 Docker 引擎实用程序。在早期版本中,NVIDIA Container Runtime for Docker 作为可选升级提供,如升级到 NVIDIA Container Runtime for Docker中所述。
  3. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。DGX Station 上的 Docker CE 版本是当您通过网络更新 DGX OS Desktop 软件时,可从 NVIDIA 存储库获得的发布版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 4.10.0 中的更新

注意

启动 DCGM 服务时,将出现类似于以下内容的版本不匹配错误消息

[78075.772392] nvidia-nvswitch: Version mismatch, kernel version 450.80.00 user version 450.51.06

这在使用 GPU 驱动程序版本高于 450.51.06 的情况下发生。版本检查发生在所有 DGX 系统上,但仅适用于 NVSwitch 系统,因此在 DGX Station/DGX-1 系统上可以忽略该消息。

支持的升级路径

版本 4.10.0 中废弃的软件包

无。

2.10. DGX OS Desktop 4.9 版本

2.10.1. DGX OS Desktop 软件版本 4.9.0

DGX OS Desktop 版本 4.9.0 中的软件版本

软件 随 R418 版本发布 使用 R450 版本 附加信息
Ubuntu Desktop 操作系统

18.04

另请参阅注释 (1)。

18.04

另请参阅注释 (1)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-151

另请参阅注释 (1)。

4.15.0-151

另请参阅注释 (1)。

 
Linux 的 NVIDIA 图形驱动程序 418.211.00 450.142.00  
NVIDIA CUDA Toolkit 10.1 Update 2 11.0.3 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 8.0.5 8.2.1 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.8.3 2.9.9 NVIDIA 深度学习 SDK 文档
NVIDIA 系统管理 (NVSM) 20.03.6 20.09.33 NVIDIA 系统管理文档
OpenGL 4.6 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

3.3.0

另请参阅注释 (2)。

3.3.0

另请参阅注释 (2)。

NVIDIA 深度学习框架文档
Docker CE

19.03.15

另请参阅注释 (3)。

19.03.15

另请参阅注释 (3)。

注意
  1. DGX OS Desktop 4.9.0 已使用此版本进行测试。如果在您升级到 DGX OS Desktop 4.9.0 之前有后续的 Linux 内核升级可用,则您的系统可能正在运行更高版本。
  2. NVIDIA Container Runtime for Docker 取代了 用于 NVIDIA GPU 的 Docker 引擎实用程序。在早期版本中,NVIDIA Container Runtime for Docker 作为可选升级提供,如升级到 NVIDIA Container Runtime for Docker中所述。
  3. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。DGX Station 上的 Docker CE 版本是当您通过网络更新 DGX OS Desktop 软件时,可从 NVIDIA 存储库获得的发布版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 4.9.0 中的更新

注意

启动 DCGM 服务时,将出现类似于以下内容的版本不匹配错误消息

[78075.772392] nvidia-nvswitch: Version mismatch, kernel version 450.80.00 user version 450.51.06

这在使用 GPU 驱动程序版本高于 450.51.06 的情况下发生。版本检查发生在所有 DGX 系统上,但仅适用于 NVSwitch 系统,因此在 DGX Station/DGX-1 系统上可以忽略该消息。

分发方法

支持的升级路径

版本 4.9.0 中废弃的软件包

无。

2.11. DGX OS Desktop 4.8 版本

2.11.1. DGX OS Desktop 软件版本 4.8.0

DGX OS Desktop 版本 4.8.0 中的软件版本

软件 随 R418 版本发布 使用 R450 版本 附加信息
Ubuntu Desktop 操作系统

18.04

另请参阅注释 (1)。

18.04

另请参阅注释 (1)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-137

另请参阅注释 (1)。

4.15.0-137

另请参阅注释 (1)。

 
Linux 的 NVIDIA 图形驱动程序 418.197.02 450.119.03  
NVIDIA CUDA Toolkit 10.1 Update 2 11.0.3 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 8.0.5 8.0.5 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.8.3 2.9.9 NVIDIA 深度学习 SDK 文档
NVIDIA 系统管理 (NVSM) 20.03.06 20.09.21 NVIDIA 系统管理文档
OpenGL 4.6 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

3.3.0

另请参阅注释 (2)。

3.3.0

另请参阅注释 (2)。

NVIDIA 深度学习框架文档
Docker CE

19.03.15

另请参阅注释 (3)。

19.03.15

另请参阅注释 (3)。

注意
  1. DGX OS Desktop 4.8.0 已使用此版本进行测试。如果在您升级到 DGX OS Desktop 4.8.0 之前有后续的 Linux 内核升级可用,则您的系统可能正在运行更高版本。
  2. NVIDIA Container Runtime for Docker 取代了 用于 NVIDIA GPU 的 Docker 引擎实用程序。在早期版本中,NVIDIA Container Runtime for Docker 作为可选升级提供,如升级到 NVIDIA Container Runtime for Docker中所述。
  3. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。DGX Station 上的 Docker CE 版本是当您通过网络更新 DGX OS Desktop 软件时,可从 NVIDIA 存储库获得的发布版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 4.8.0 中的更新

注意

启动 DCGM 服务时,将出现类似于以下内容的版本不匹配错误消息

[78075.772392] nvidia-nvswitch: Version mismatch, kernel version 450.80.00 user version 450.51.06

这在使用 GPU 驱动程序版本高于 450.51.06 的情况下发生。版本检查发生在所有 DGX 系统上,但仅适用于 NVSwitch 系统,因此在 DGX Station/DGX-1 系统上可以忽略该消息。

分发方法

支持的升级路径

版本 4.8.0 中废弃的软件包

无。

2.12. DGX OS Desktop 4.7 版本

2.12.1. DGX OS Desktop 软件版本 4.7.0

DGX OS Desktop 版本 4.7.0 中的软件版本

软件 随 R418 版本发布 使用 R450 版本 附加信息
Ubuntu Desktop 操作系统

18.04

另请参阅注释 (1)。

18.04

另请参阅注释 (1)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-124

另请参阅注释 (1)。

4.15.0-124

另请参阅注释 (1)。

 
Linux 的 NVIDIA 图形驱动程序 418.181.07 450.102.04  
NVIDIA CUDA Toolkit 10.1 Update 2 11.0.3 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 8.0.5 8.0.5 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.8.3 2.8.3 NVIDIA 深度学习 SDK 文档
NVIDIA 系统管理 (NVSM) 20.03.06 20.05.19 NVIDIA 系统管理文档
OpenGL 4.6 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

3.3.0

另请参阅注释 (2)。

3.3.0

另请参阅注释 (2)。

NVIDIA 深度学习框架文档
Docker CE

19.03.14

另请参阅注释 (3)。

19.03.14

另请参阅注释 (3)。

注意
  1. DGX OS Desktop 4.7.0 已使用此版本进行测试。如果在您升级到 DGX OS Desktop 4.7.0 之前有后续的 Linux 内核升级可用,则您的系统可能正在运行更高版本。
  2. NVIDIA Container Runtime for Docker 取代了 用于 NVIDIA GPU 的 Docker 引擎实用程序。在早期版本中,NVIDIA Container Runtime for Docker 作为可选升级提供,如升级到 NVIDIA Container Runtime for Docker中所述。
  3. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。DGX Station 上的 Docker CE 版本是当您通过网络更新 DGX OS Desktop 软件时,可从 NVIDIA 存储库获得的发布版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 4.7.0 中的更新

注意

启动 DCGM 服务时,将出现类似于以下内容的版本不匹配错误消息

[78075.772392] nvidia-nvswitch: Version mismatch, kernel version 450.80.00 user version 450.51.06

这在使用 GPU 驱动程序版本高于 450.51.06 的情况下发生。版本检查发生在所有 DGX 系统上,但仅适用于 NVSwitch 系统,因此在 DGX Station/DGX-1 系统上可以忽略该消息。

分发方法

支持的升级路径

版本 4.7.0 中废弃的软件包

无。

2.13. DGX OS Desktop 4.6 版本

2.13.1. DGX OS Desktop 软件版本 4.6.0

DGX OS Desktop 版本 4.6.0 中的软件版本

软件 随 R418 版本发布 使用 R450 版本 附加信息
Ubuntu Desktop 操作系统

18.04.3

另请参阅注释 (1)。

18.04.3

另请参阅注释 (1)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-112-generic

另请参阅注释 (1)。

4.15.0-112-generic

另请参阅注释 (1)。

 
Linux 的 NVIDIA 图形驱动程序 418.165.02 450.80.02  
NVIDIA CUDA Toolkit 10.1 11.0 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 8.0.2.39+CUDA 10.1 8.0.4.8+CUDA 11.0 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.7.8-1+CUDA 10.1 2.7.8-1+CUDA 11.0 NVIDIA 深度学习 SDK 文档
NVIDIA 系统管理 (NVSM) 20.03.06 20.05.19 NVIDIA 系统管理文档
OpenGL 4.6 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

3.3.0-1

另请参阅注释 (2)。

3.3.0-1

另请参阅注释 (2)。

NVIDIA 深度学习框架文档
Docker CE

19.03.12

另请参阅注释 (3)。

19.03.12

另请参阅注释 (3)。

注意
  1. DGX OS Desktop 4.6.0 已使用此版本进行测试。如果在您升级到 DGX OS Desktop 4.6.0 之前有后续的 Linux 内核升级可用,则您的系统可能正在运行更高版本。
  2. NVIDIA Container Runtime for Docker 取代了 用于 NVIDIA GPU 的 Docker 引擎实用程序。在早期版本中,NVIDIA Container Runtime for Docker 作为可选升级提供,如升级到 NVIDIA Container Runtime for Docker中所述。
  3. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。DGX Station 上的 Docker CE 版本是当您通过网络更新 DGX OS Desktop 软件时,可从 NVIDIA 存储库获得的发布版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 4.6.0 中的更新

注意

启动 DCGM 服务时,将出现类似于以下内容的版本不匹配错误消息

[78075.772392] nvidia-nvswitch: Version mismatch, kernel version 450.80.00 user version 450.51.06

这在使用 GPU 驱动程序版本高于 450.51.06 的情况下发生。版本检查发生在所有 DGX 系统上,但仅适用于 NVSwitch 系统,因此在 DGX Station/DGX-1 系统上可以忽略该消息。

分发方法

支持的升级路径

版本 4.6.0 中废弃的软件包

无。

2.14. DGX OS Desktop 4.5 版本

2.14.1. DGX OS Desktop 软件版本 4.5.0

DGX OS Desktop 版本 4.5.0 中的软件版本

软件 随 R418 版本发布 使用 R450 版本 附加信息
Ubuntu Desktop 操作系统

18.04.3

另请参阅注释 (1)。

18.04.3

另请参阅注释 (1)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-106-generic

另请参阅注释 (1)。

4.15.0-106-generic

另请参阅注释 (1)。

 
Linux 的 NVIDIA 图形驱动程序 418.152.00 450.51.05  
NVIDIA CUDA Toolkit 10.1.243 11.0 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 7.6.5 8.0.0 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.6.4 2.7.3 NVIDIA 深度学习 SDK 文档
NVIDIA 系统管理 (NVSM) 20.03.06 20.05.09 NVIDIA 系统管理文档
OpenGL 4.6 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

3.1.4

另请参阅注释 (2)。

3.1.4

另请参阅注释 (2)。

NVIDIA 深度学习框架文档
Docker CE

19.03.8

另请参阅注释 (3)。

19.03.8

另请参阅注释 (3)。

注意
  1. DGX OS Desktop 4.5.0 已使用此版本进行测试。如果在您升级到 DGX OS Desktop 4.5.0 之前有后续的 Linux 内核升级可用,则您的系统可能正在运行更高版本。
  2. NVIDIA Container Runtime for Docker 取代了 用于 NVIDIA GPU 的 Docker 引擎实用程序。在早期版本中,NVIDIA Container Runtime for Docker 作为可选升级提供,如升级到 NVIDIA Container Runtime for Docker中所述。
  3. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。DGX Station 上的 Docker CE 版本是当您通过网络更新 DGX OS Desktop 软件时,可从 NVIDIA 存储库获得的发布版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 4.5.0 中的更新

  • 新软件版本
  • 支持 DGX Station 上的 NVSM 命令 nvsm show healthnvsm dump health,这些命令取代了 nvhealthnvsysinfo 命令
  • 支持禁用和恢复 CPU 缓解措施

分发方法

支持的升级路径

版本 4.5.0 中废弃的软件包

无。

2.15. DGX OS Desktop 4.4 版本

2.15.1. DGX OS Desktop 软件版本 4.4.0

DGX OS Desktop 版本 4.4.0 中的软件版本

软件 版本 附加信息
Ubuntu Desktop 操作系统

18.04.3

另请参阅注释 (1)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-76-generic

另请参阅注释 (1)。

 
Linux 的 NVIDIA 图形驱动程序 418.126.02  
NVIDIA CUDA Toolkit 10.1.243 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 7.6.5 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.5.6 NVIDIA 深度学习 SDK 文档
NVIDIA 系统管理 (NVSM) 20.01.15 NVIDIA 系统管理文档
OpenGL 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

3.1.4

另请参阅注释 (2)。

NVIDIA 深度学习框架文档
Docker CE

19.03.5

另请参阅注释 (3)。

注意
  1. DGX OS Desktop 4.4.0 已使用此版本进行测试。如果在您升级到 DGX OS Desktop 4.4.0 之前有后续的 Linux 内核升级可用,则您的系统可能正在运行更高版本。
  2. NVIDIA Container Runtime for Docker 取代了 用于 NVIDIA GPU 的 Docker 引擎实用程序。在早期版本中,NVIDIA Container Runtime for Docker 作为可选升级提供,如升级到 NVIDIA Container Runtime for Docker中所述。
  3. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。DGX Station 上的 Docker CE 版本是当您通过网络更新 DGX OS Desktop 软件时,可从 NVIDIA 存储库获得的发布版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 4.4.0 中的更新

  • 新软件版本
  • 支持 DGX Station 上的 NVSM 命令 nvsm show healthnvsm dump health,这些命令取代了 nvhealthnvsysinfo 命令
  • 支持禁用和恢复 CPU 缓解措施

分发方法

支持的升级路径

版本 4.4.0 中废弃的软件包

  • nvhealth
  • nvsysinfo

2.16. DGX OS Desktop 4.3 版本

2.16.1. DGX OS Desktop 软件版本 4.3.0

DGX OS Desktop 版本 4.3.0 中的软件版本

软件 版本 附加信息
Ubuntu Desktop 操作系统

18.04.3

另请参阅注释 (1)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-55-generic

另请参阅注释 (1)。

 
Linux 的 NVIDIA 图形驱动程序 418.116.00  
NVIDIA CUDA Toolkit 10.1.243 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 7.6.2 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.4.7 NVIDIA 深度学习 SDK 文档
OpenGL 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

3.1.1

另请参阅注释 (2)。

NVIDIA 深度学习框架文档
Docker CE

19.03.4

另请参阅注释 (3)。

注意
  1. DGX OS Desktop 4.3.0 已使用此版本进行测试。由于 DGX OS Desktop 的升级,您的系统可能正在运行更高版本。
  2. NVIDIA Container Runtime for Docker 取代了 用于 NVIDIA GPU 的 Docker 引擎实用程序。在早期版本中,NVIDIA Container Runtime for Docker 作为可选升级提供,如升级到 NVIDIA Container Runtime for Docker中所述。
  3. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。DGX Station 上的 Docker CE 版本是当您通过网络更新 DGX OS Desktop 软件时,可从 NVIDIA 存储库获得的发布版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 4.3.0 中的更新

分发方法

支持的升级路径

版本 4.3.0 中废弃的软件包

无。

2.17. DGX OS Desktop 4.2 版本

2.17.1. DGX OS Desktop 软件版本 4.2.0

DGX OS Desktop 版本 4.2.0 中的软件版本

软件 版本 附加信息
Ubuntu Desktop 操作系统

18.04.3

另请参阅注释 (1)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-55-generic

另请参阅注释 (1)。

 
Linux 的 NVIDIA 图形驱动程序 418.87.01  
NVIDIA CUDA Toolkit 10.1.243 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 7.6.2 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.4.7 NVIDIA 深度学习 SDK 文档
OpenGL 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

3.1.1

另请参阅注释 (2)。

NVIDIA 深度学习框架文档
Docker CE

19.03

另请参阅注释 (3)。

注意
  1. DGX OS Desktop 4.2.0 已使用此版本进行测试。由于 DGX OS Desktop 的升级,您的系统可能正在运行更高版本。
  2. NVIDIA Container Runtime for Docker 取代了 用于 NVIDIA GPU 的 Docker 引擎实用程序。在早期版本中,NVIDIA Container Runtime for Docker 作为可选升级提供,如升级到 NVIDIA Container Runtime for Docker中所述。
  3. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。DGX Station 上的 Docker CE 版本是当您通过网络更新 DGX OS Desktop 软件时,可从 NVIDIA 存储库获得的发布版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 4.2.0 中的更新

DGX OS 桌面 版本引入了自补丁更新 4.1.1 以来的新软件版本,并累积了先前通过补丁更新 4.1.1 分发的新软件版本。

  • 自补丁更新 4.1.1 以来的新软件版本
    • Ubuntu Desktop 操作系统 18.04.3
    • Linux 的 NVIDIA 图形驱动程序 418.87.01
    • 适用于 Docker 的 NVIDIA 容器运行时 3.1.1
    • Docker CE 19.03
  • 先前通过补丁更新 4.1.1 分发的新软件版本

分发方法

支持的升级路径 - 请参阅

版本 4.2.0 中废弃的软件包

无。

2.18. DGX OS Desktop 4.1 版本

2.18.1. DGX OS Desktop 软件补丁更新 4.1.1

DGX OS Desktop 补丁更新 4.1.1 中的软件版本

软件 版本 附加信息
Ubuntu Desktop 操作系统

18.04 LTS

另请参阅注释 (1)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-55-generic

另请参阅注释 (1)。

 
Linux 的 NVIDIA 图形驱动程序 418.87.00  
NVIDIA CUDA Toolkit 10.1.243 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 7.6.2 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.4.7 NVIDIA 深度学习 SDK 文档
OpenGL 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

3.0.0

另请参阅注释 (2)。

NVIDIA 深度学习框架文档
Docker CE

18.09.8

另请参阅注释 (3)。

注意
  1. DGX OS Desktop 4.1.1 已使用此版本进行测试。由于 DGX OS Desktop 的升级,您的系统可能正在运行更高版本。
  2. NVIDIA Container Runtime for Docker 取代了 用于 NVIDIA GPU 的 Docker 引擎实用程序。在早期版本中,NVIDIA Container Runtime for Docker 作为可选升级提供,如升级到 NVIDIA Container Runtime for Docker中所述。
  3. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。DGX Station 上的 Docker CE 版本是当您通过网络更新 DGX OS Desktop 软件时,可从 NVIDIA 存储库获得的发布版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

补丁更新 4.1.1 中的更新

  • 新软件版本
    • Linux 的 NVIDIA 图形驱动程序 418.87.00
    • NVIDIA CUDA Toolkit 10.1.243
    • NVIDIA cuDNN 库 7.6.2
    • NCCL 2.4.7
    • 适用于 Docker 的 NVIDIA 容器运行时 3.0.0
    • Docker CE 18.09.8

分发方法

支持的升级路径

补丁更新 4.1.1 中废弃的软件包

libnvidia-diagnostic-418

2.18.2. DGX OS Desktop 软件版本 4.1.0

DGX OS Desktop 版本 4.1.0 中的软件版本

软件 版本 附加信息
Ubuntu Desktop 操作系统

18.04 LTS

另请参阅注释 (1)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-47-generic

另请参阅注释 (1)。

 
Linux 的 NVIDIA 图形驱动程序 418.67  
NVIDIA CUDA Toolkit 10.1.168 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 7.5.0 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.4.2 NVIDIA 深度学习 SDK 文档
OpenGL 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

2.0

另请参阅注释 (2)。

NVIDIA 深度学习框架文档
Docker CE

18.09.4

另请参阅注释 (3)。

注意
  1. DGX OS Desktop 4.1.0 已使用此版本进行测试。由于 DGX OS Desktop 的升级,您的系统可能正在运行更高版本。
  2. NVIDIA Container Runtime for Docker 取代了 用于 NVIDIA GPU 的 Docker 引擎实用程序。在早期版本中,NVIDIA Container Runtime for Docker 作为可选升级提供,如升级到 NVIDIA Container Runtime for Docker中所述。
  3. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。DGX Station 上的 Docker CE 版本是当您通过网络更新 DGX OS Desktop 软件时,可从 NVIDIA 存储库获得的发布版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 4.1.0 中的更新

  • 新软件版本

支持的升级路径

版本 4.1.0 中废弃的软件包

无。

2.19. DGX OS Desktop 4.0 版本

2.19.1. DGX OS Desktop 软件版本 4.0.7

DGX OS Desktop 版本 4.0.7 中的软件版本

软件 版本 附加信息
Ubuntu Desktop 操作系统

18.04 LTS

另请参阅注释 (1)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-47-generic

另请参阅注释 (1)。

 
Linux 的 NVIDIA 图形驱动程序 410.129  
NVIDIA CUDA Toolkit 10.0.130 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 7.5.0 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.4.2 NVIDIA 深度学习 SDK 文档
OpenGL 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

2.0

另请参阅注释 (2)。

NVIDIA 深度学习框架文档
Docker CE

18.09.4

另请参阅注释 (3)。

注意
  1. DGX OS Desktop 4.0.7 已使用此版本进行测试。由于 DGX OS Desktop 的升级,您的系统可能正在运行更高版本。
  2. NVIDIA Container Runtime for Docker 取代了 用于 NVIDIA GPU 的 Docker 引擎实用程序。在早期版本中,NVIDIA Container Runtime for Docker 作为可选升级提供,如升级到 NVIDIA Container Runtime for Docker中所述。
  3. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。DGX Station 上的 Docker CE 版本是当您通过网络更新 DGX OS Desktop 软件时,可从 NVIDIA 存储库获得的发布版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 4.0.7 中的更新

  • 新软件版本:Linux 的 NVIDIA 图形驱动程序 410.129

分发方法

支持的升级路径

4.0.4 到 4.0.6 升级到 4.12.0。 有关说明,请参阅《DGX 工作站用户指南》中“在同一 DGX OS Desktop 主要版本内升级”

注意: 从 3.1.1 到 3.1.8 升级到 4.12.0 已不再可用。 按照《DGX 工作站用户指南》中“升级到新的 DGX OS Desktop 主要版本”中的说明进行操作,会将您的 DGX OS Desktop 软件升级到版本 4.13.0

版本 4.0.7 中废弃的软件包

无。

2.19.2. DGX OS Desktop 软件版本 4.0.6

DGX OS Desktop 版本 4.0.6 中的软件版本

软件 版本 附加信息
Ubuntu Desktop 操作系统

18.04 LTS

另请参阅注释 (1)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-47-generic

另请参阅注释 (1)。

 
Linux 的 NVIDIA 图形驱动程序 410.104  
NVIDIA CUDA Toolkit 10.0.130 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 7.5.0 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.4.2 NVIDIA 深度学习 SDK 文档
OpenGL 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

2.0

另请参阅注释 (2)。

NVIDIA 深度学习框架文档
Docker CE

18.09.4

另请参阅注释 (3)。

注意
  1. DGX OS Desktop 4.0.6 已使用此版本进行测试。由于 DGX OS Desktop 的升级,您的系统可能正在运行更高版本。
  2. NVIDIA Container Runtime for Docker 取代了 用于 NVIDIA GPU 的 Docker 引擎实用程序。在早期版本中,NVIDIA Container Runtime for Docker 作为可选升级提供,如升级到 NVIDIA Container Runtime for Docker中所述。
  3. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。当您通过网络更新 DGX OS Desktop 软件时,您的 DGX Station 上发布的 Docker CE 版本是从此 NVIDIA 存储库获得的版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 4.0.6 中的更新

版本 4.0.6 中废弃的软件包

无。

2.19.3. DGX OS Desktop 软件版本 4.0.5

DGX OS Desktop 版本 4.0.5 中的软件版本

软件 版本 附加信息
Ubuntu Desktop 操作系统

18.04 LTS

另请参见注释 (1)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-36-generic

另请参见注释 (1)。

 
Linux 的 NVIDIA 图形驱动程序 410.104  
NVIDIA CUDA Toolkit 10.0.130 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 7.4.2 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.4.2 NVIDIA 深度学习 SDK 文档
OpenGL 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

2.0

参见注释 (2)。

NVIDIA 深度学习框架文档
Docker CE

18.09.2

另请参见注释 (3)。

分发方法

注意
  1. DGX OS Desktop 4.0.5 已使用此版本进行测试。由于升级到 DGX OS Desktop,您的系统可能正在运行更高版本。
  2. 用于 Docker 的 NVIDIA 容器运行时取代了用于 NVIDIA GPU 的 Docker 引擎实用程序。在早期版本中,用于 Docker 的 NVIDIA 容器运行时作为可选升级提供,如升级到 NVIDIA 容器运行时 for Docker中所述。
  3. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。当您通过网络更新 DGX OS Desktop 软件时,您的 DGX Station 上发布的 Docker CE 版本是从此 NVIDIA 存储库获得的版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 4.0.5 中的更新

支持的升级路径

版本 4.0.5 中废弃的软件包

无。

2.19.4. DGX OS Desktop 软件版本 4.0.4

DGX OS Desktop 版本 4.0.4 中的软件版本

软件 版本 附加信息
Ubuntu Desktop 操作系统

18.04 LTS

另请参见注释 (1)。

Ubuntu 18.04 Desktop 指南
Linux 内核

4.15.0-36-generic

另请参见注释 (1)。

 
Linux 的 NVIDIA 图形驱动程序 410.79  
NVIDIA CUDA Toolkit 10.0.130 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 7.3.1 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.3.5-4 NVIDIA 深度学习 SDK 文档
OpenGL 4.6 OpenGL API 文档概述
适用于 Docker 的 NVIDIA 容器运行时

2.0

参见注释 (2)。

NVIDIA 深度学习框架文档
Docker CE

18.06.1

另请参见注释 (3)。

注意
  1. DGX OS Desktop 4.0.4 已使用此版本进行测试。由于升级到 DGX OS Desktop,您的系统可能正在运行更高版本。
  2. 用于 Docker 的 NVIDIA 容器运行时取代了用于 NVIDIA GPU 的 Docker 引擎实用程序。在早期版本中,用于 Docker 的 NVIDIA 容器运行时作为可选升级提供,如升级到 NVIDIA 容器运行时 for Docker中所述。
  3. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。当您通过网络更新 DGX OS Desktop 软件时,您的 DGX Station 上发布的 Docker CE 版本是从此 NVIDIA 存储库获得的版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 4.0.4 中的更新

  • 新软件版本
    • Ubuntu Desktop 操作系统 18.04 LTS

      在 Ubuntu 18.04 中,GNOME 桌面环境取代了 Unity 桌面环境。有关 GNOME 桌面环境入门的帮助,请参阅 Ubuntu 18.04 官方文档中的 GNOME 简介

    • Linux 的 NVIDIA 图形驱动程序 410.79
    • NVIDIA CUDA Toolkit 10.0.130
    • NVIDIA cuDNN 库 7.3.1
    • NCCL 2.3.5-4
    • Docker CE 18.06.1
  • 引入 适用于 Docker 的 NVIDIA 容器运行时 以取代 适用于 NVIDIA GPU 的 Docker Engine 实用程序

版本 4.0.4 中废弃的软件包

nvidia-docker

注意: 由于更新到新版本的 Ubuntu Desktop 操作系统,Canonical 的许多软件包在此 DGX OS 桌面 版本中也被废弃。

3. DGX OS Desktop 3 版本

3.1. DGX OS Desktop 3 版本历史

3.1.1. DGX OS Desktop 3 更新

版本 3.1.8 中的更新

版本 3.1.7 中的更新

  • 新软件版本
    • 用于 Linux 384.145 的 NVIDIA 显卡驱动程序
    • NVIDIA cuDNN 库 7.1.4
    • NCCL 2.2.12
    • Docker CE 18.03.1
  • 安全更新

版本 3.1.6 中的更新

  • 新软件版本
    • 用于 Linux 384.125 的 NVIDIA 显卡驱动程序
    • NVIDIA cuDNN 库 7.1.1
    • NCCL 2.1.15
  • 支持 32-GB GPU
  • 安全更新

版本 3.1.4 中的更新

  • 新软件版本

    • 用于 Linux 384.111 的 NVIDIA 显卡驱动程序

    • NVIDIA cuDNN 库 7.0.5-15

    • NCCL 2.1.2

    • 来自 Docker 稳定存储库的 Docker CE

  • 用于收集故障排除信息的命令的新名称 nvsysinfo

  • 从 Docker CE 服务配置文件 docker-override.conf 中删除 Docker CE 启动选项 --disable-legacy-registry=false

    删除此选项是为了与 Docker CE 17.12 及更高版本兼容,这些版本不支持与使用 API 版本 v1 的注册表交互。

版本 3.1.3 中的更新

  • 新软件版本
    • NVIDIA cuDNN 库 7.0.4
    • NCCL 2.0.5
  • 新功能
    • DGX Station 启动后热插拔显示器,而无需连接显示器
    • 数据日志记录,以更可靠地保存文件系统元数据,并使文件系统更能抵抗电源故障
  • 解决 DGX Station 启动时以太网连接失败问题

版本 3.1.2 中的更新

  • 新软件版本
    • 用于 Linux 384.81 的 NVIDIA 显卡驱动程序
    • NVIDIA CUDA 工具包 9.0.176
    • NVIDIA cuDNN 库 7.0.1.13-1
    • NCCL 2.0.4
  • 用于 NVIDIA Docker 容器版本 17.09 的性能优化
  • 解决 CUDA 应用程序的待机和恢复问题

版本 3.1.1 中的更新

此版本是 DGX OS Desktop 软件的第一个版本。

3.1.3. DGX OS Desktop 3 已淘汰的软件包

版本 3.1.8 中已淘汰的软件包

无。

版本 3.1.7 中已淘汰的软件包

无。

版本 3.1.6 中已淘汰的软件包

  • nvhealth-doc
  • nvhealth-framework
  • nvhealth-module-dcgm-diag
  • nvhealth-module-df
  • nvhealth-module-docker-hello-world
  • nvhealth-module-dpkg
  • nvhealth-module-ethernet
  • nvhealth-module-kernel-modules
  • nvhealth-module-lscpu
  • nvhealth-module-lshw
  • nvhealth-module-lspci
  • nvhealth-module-meminfo
  • nvhealth-module-nvidia-persistenced
  • nvhealth-module-nvidia-smi
  • nvhealth-module-ping
  • nvhealth-module-ps
  • nvhealth-module-smartctl
  • nvhealth-module-systemd-services
  • nvhealth-module-template
  • nvhealth-module-uname
  • nvhealth-station

版本 3.1.4 中已淘汰的软件包

  • nvhealth-base
  • nvhealth-dgx-baseos
  • nvhealth-overlay-dgx
  • nvhealth-overlay-dgx-station
  • nvhealth-overlay-dgx-station-baseos-3.1.0
  • nvhealth-overlay-dgx-station-volta
  • nvidia-sysinfo

版本 3.1.3 中已淘汰的软件包

无。

版本 3.1.2 中已淘汰的软件包

无。

3.2. DGX OS Desktop 软件版本 3.1.8

注意

DGX OS Desktop 版本 3.1.8 中的软件版本

软件 版本 附加信息
Ubuntu Desktop 操作系统 16.04 LTS Ubuntu 16.04 桌面指南
Linux 的 NVIDIA 图形驱动程序 384.183  
NVIDIA CUDA Toolkit 9.0.176 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 7.4.2 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.4.2 NVIDIA 深度学习 SDK 文档
OpenGL 4.5 OpenGL API 文档概述
用于 NVIDIA GPU 的 Docker 引擎实用程序

1.0.1

另请参见注释 (1)。

NVIDIA 深度学习框架文档
Docker CE

18.09.2

另请参见注释 (2)。

注意
  1. 用于 Docker 的 NVIDIA 容器运行时作为可选升级提供,以取代用于 NVIDIA GPU 的 Docker 引擎实用程序。有关更多信息,请参阅升级到 NVIDIA 容器运行时 for Docker
  2. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。当您通过网络更新 DGX OS Desktop 软件时,您的 DGX Station 上发布的 Docker CE 版本是从此 NVIDIA 存储库获得的版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 3.1.8 中的更新

支持的升级路径

  • 3.1.3 到 3.1.8
  • 3.1.4 到 3.1.8
  • 3.1.6 到 3.1.8
  • 3.1.7 到 3.1.8

有关说明,请参阅《DGX Station 用户指南》中“在同一 DGX OS Desktop 主要版本中升级”

注意:如果出现消息指示 nvidia-docker.service 启动失败,您可以忽略该消息并继续更新。nvidia-docker.service 服务将在下次重新启动 DGX Station 时正常启动。

版本 3.1.8 中已淘汰的软件包

无。

3.3. DGX OS Desktop 软件版本 3.1.7

DGX OS Desktop 版本 3.1.7 中的软件版本

软件 版本 附加信息
Ubuntu Desktop 操作系统 16.04 LTS Ubuntu 16.04 桌面指南
Linux 的 NVIDIA 图形驱动程序 384.145  
NVIDIA CUDA Toolkit 9.0.176 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 7.1.4 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.2.12 NVIDIA 深度学习 SDK 文档
OpenGL 4.5 OpenGL API 文档概述
用于 NVIDIA GPU 的 Docker 引擎实用程序

1.0.1

另请参见注释 (1)。

NVIDIA 深度学习框架文档
Docker CE

18.03.1

另请参见注释 (2)。

注意
  1. 用于 Docker 的 NVIDIA 容器运行时作为可选升级提供,以取代用于 NVIDIA GPU 的 Docker 引擎实用程序。有关更多信息,请参阅升级到 NVIDIA 容器运行时 for Docker
  2. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。当您通过网络更新 DGX OS Desktop 软件时,您的 DGX Station 上发布的 Docker CE 版本是从此 NVIDIA 存储库获得的版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 3.1.7 中的更新

  • 新软件版本
    • 用于 Linux 384.145 的 NVIDIA 显卡驱动程序
    • NVIDIA cuDNN 库 7.1.4
    • NCCL 2.2.12
    • Docker CE 18.03.1
  • 安全更新

支持的升级路径

版本 3.1.7 中已淘汰的软件包

无。

3.4. DGX OS Desktop 软件版本 3.1.6

DGX OS Desktop 版本 3.1.6 中的软件版本

软件 版本 附加信息
Ubuntu Desktop 操作系统 16.04 LTS Ubuntu 16.04 桌面指南
Linux 的 NVIDIA 图形驱动程序 384.125  
NVIDIA CUDA Toolkit 9.0.176 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 7.1.1 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.1.15 NVIDIA 深度学习 SDK 文档
OpenGL 4.5 OpenGL API 文档概述
用于 NVIDIA GPU 的 Docker 引擎实用程序

1.0.1

另请参见注释 (1)。

NVIDIA 深度学习框架文档
Docker CE

17.12.1

另请参见注释 (2)。

注意
  1. 用于 Docker 的 NVIDIA 容器运行时作为可选升级提供,以取代用于 NVIDIA GPU 的 Docker 引擎实用程序。有关更多信息,请参阅升级到 NVIDIA 容器运行时 for Docker
  2. Docker CE 的更新不再从 Docker 的稳定存储库提供,而是从 NVIDIA 维护的存储库提供。当您通过网络更新 DGX OS Desktop 软件时,您的 DGX Station 上发布的 Docker CE 版本是从此 NVIDIA 存储库获得的版本。

    要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

    # dpkg -l docker-ce

版本 3.1.6 中的更新

  • 新软件版本
    • 用于 Linux 384.125 的 NVIDIA 显卡驱动程序
    • NVIDIA cuDNN 库 7.1.1
    • NCCL 2.1.15
  • 支持 32-GB GPU
  • 安全更新

支持的升级路径

版本 3.1.6 中已淘汰的软件包

  • nvhealth-doc
  • nvhealth-framework
  • nvhealth-module-dcgm-diag
  • nvhealth-module-df
  • nvhealth-module-docker-hello-world
  • nvhealth-module-dpkg
  • nvhealth-module-ethernet
  • nvhealth-module-kernel-modules
  • nvhealth-module-lscpu
  • nvhealth-module-lshw
  • nvhealth-module-lspci
  • nvhealth-module-meminfo
  • nvhealth-module-nvidia-persistenced
  • nvhealth-module-nvidia-smi
  • nvhealth-module-ping
  • nvhealth-module-ps
  • nvhealth-module-smartctl
  • nvhealth-module-systemd-services
  • nvhealth-module-template
  • nvhealth-module-uname
  • nvhealth-station

3.5. DGX OS Desktop 软件版本 3.1.4

DGX OS Desktop 版本 3.1.4 中的软件版本

软件 版本 附加信息
Ubuntu Desktop 操作系统 16.04 LTS Ubuntu 16.04 桌面指南
Linux 的 NVIDIA 图形驱动程序 384.111  
NVIDIA CUDA Toolkit 9.0.176 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 7.0.5-15 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.1.2 NVIDIA 深度学习 SDK 文档
OpenGL 4.5 OpenGL API 文档概述
用于 NVIDIA GPU 的 Docker 引擎实用程序 1.0.1 NVIDIA 深度学习框架文档
Docker CE 参见注释
注意

当您通过网络更新 DGX OS Desktop 软件时,您的 DGX Station 上发布的 Docker CE 版本是从 Docker 的稳定存储库获得的版本。

要确定您的 DGX Station 上安装的 Docker CE 版本,请运行以下命令

# dpkg -l docker-ce

版本 3.1.4 中的更新

  • 新软件版本

    • 用于 Linux 384.111 的 NVIDIA 显卡驱动程序

    • NVIDIA cuDNN 库 7.0.5-15

    • NCCL 2.1.2

    • 来自 Docker 稳定存储库的 Docker CE

  • 用于收集故障排除信息的命令的新名称 nvsysinfo

  • 从 Docker CE 服务配置文件 docker-override.conf 中删除 Docker CE 启动选项 --disable-legacy-registry=false

    删除此选项是为了与 Docker CE 17.12 及更高版本兼容,这些版本不支持与使用 API 版本 v1 的注册表交互。

支持的升级路径

版本 3.1.4 中已淘汰的软件包

  • nvhealth-base
  • nvhealth-dgx-baseos
  • nvhealth-overlay-dgx
  • nvhealth-overlay-dgx-station
  • nvhealth-overlay-dgx-station-baseos-3.1.0
  • nvhealth-overlay-dgx-station-volta
  • nvidia-sysinfo

3.6. DGX OS Desktop 软件版本 3.1.3

DGX OS Desktop 版本 3.1.3 中的软件版本

软件 版本 附加信息
Ubuntu Desktop 操作系统 16.04 LTS Ubuntu 16.04 桌面指南
Linux 的 NVIDIA 图形驱动程序 384.81  
NVIDIA CUDA Toolkit 9.0.176 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 7.0.4 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.0.5 NVIDIA 深度学习 SDK 文档
OpenGL 4.5 OpenGL API 文档概述
用于 NVIDIA GPU 的 Docker 引擎实用程序 1.0.1 NVIDIA 深度学习框架文档
Docker CE 17.06

版本 3.1.3 中的更新

  • 新软件版本
    • NVIDIA cuDNN 库 7.0.4
    • NCCL 2.0.5
  • 新功能
    • DGX Station 启动后热插拔显示器,而无需连接显示器
    • 数据日志记录,以更可靠地保存文件系统元数据,并使文件系统更能抵抗电源故障
  • 解决 DGX Station 启动时以太网连接失败问题

支持的升级路径

版本 3.1.3 中已解决的问题

版本 3.1.3 中已淘汰的软件包

无。

3.7. DGX OS Desktop 软件版本 3.1.2

DGX OS Desktop 版本 3.1.2 中的软件版本

软件 版本 附加信息
Ubuntu Desktop 操作系统 16.04 LTS Ubuntu 16.04 桌面指南
Linux 的 NVIDIA 图形驱动程序 384.81  
NVIDIA CUDA Toolkit 9.0.176 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 7.0.1.13-1 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.0.4 NVIDIA 深度学习 SDK 文档
OpenGL 4.5 OpenGL API 文档概述
用于 NVIDIA GPU 的 Docker 引擎实用程序 1.0.1 NVIDIA 深度学习框架文档
Docker CE 17.06

版本 3.1.2 中的更新

  • 新软件版本
    • 用于 Linux 384.81 的 NVIDIA 显卡驱动程序
    • NVIDIA CUDA 工具包 9.0.176
    • NVIDIA cuDNN 库 7.0.1.13-1
    • NCCL 2.0.4
  • 用于 NVIDIA Docker 容器版本 17.09 的性能优化
  • 解决 CUDA 应用程序的待机和恢复问题

支持的升级路径

版本 3.1.2 中已解决的问题

版本 3.1.2 中已淘汰的软件包

无。

3.8. DGX OS Desktop 软件版本 3.1.1

DGX OS Desktop 版本 3.1.1 中的软件版本

软件 版本 附加信息
Ubuntu Desktop 操作系统 16.04 LTS Ubuntu 16.04 桌面指南
Linux 的 NVIDIA 图形驱动程序 384.80  
NVIDIA CUDA Toolkit 9.0.103 CUDA Toolkit 文档
NVIDIA CUDA 深度神经网络 (cuDNN) 库 7.0.1 NVIDIA 深度学习 SDK 文档
NVIDIA 集体通信库 (NCCL) 2.0.4 NVIDIA 深度学习 SDK 文档
OpenGL 4.5 OpenGL API 文档概述
用于 NVIDIA GPU 的 Docker 引擎实用程序 1.0.1 NVIDIA 深度学习框架文档
Docker CE 17.06

版本 3.1.1 中的更新

此版本是 DGX OS Desktop 软件的第一个版本。

4. 已知问题

4.1. 调用 cuCTXCreate API 的应用程序可能会遇到性能下降

描述

DGX Station 中,当某些应用程序调用 cuCtxCreatecuGLCtxCreatecuCtxDestroy 时,可能会出现性能下降。

影响版本

5.0.0

解决方法

此问题发生在 Ubuntu 20.04 中,但在以前的版本中不会发生。此问题会影响执行图形/计算互操作或具有 CUDA 插件机制的应用程序,其中每个插件都创建自己的上下文,或者视频流应用程序(需要计算)。例如,ffmpegBlendersimpleDrvRuntimecuSolverSp_LinearSolver

预计此问题不会影响深度学习训练。

4.2. NVSM 平台显示为不受支持

描述

DGX Station 中,当您运行
$ nvsm show version
而不是显示 DGX Station 时,platform 字段显示 Unsupported

影响版本

5.0.0

解决方法

您可以忽略此消息。

4.4. 非英语区域设置中 nvhealth 输出中逻辑 CPU 核心数未知

描述

如果区域设置不是英语,则 nvhealth 命令会将逻辑 CPU 核心数列为 Unknown

$ sudo nvhealth
...
Number of logical CPU cores [None]................................... Unknown
...

影响版本

4.1.0 到 4.14.0

4.5. DGX OS Desktop 版本升级问题

描述

DGX OS Desktop 版本升级后,可能会出现以下问题

  • 桌面布局未从 Unity 桌面环境更新到 GNOME 桌面环境。
  • 此显示管理器是 lightdm 而不是 gdm3

影响版本

4.0.4 到 4.14.0

解决方法

此解决方法需要管理员权限。

  1. Ctrl+Alt+F5 切换到 tty5

  2. 启动 gdm3 服务。

    # sudo systemctl start gdm3
  3. Ctrl+Alt+F6 切换到 tty6

  4. 重新配置您的系统以使用 gdm3 显示管理器而不是 lightdm

    1. 重新配置 gdm3 软件包。

      # sudo dpkg-reconfigure gdm3
    2. 在提示符响应中,选择 gdm3
  5. 重新启动系统。

    # sudo reboot
  6. 在系统重新启动后出现的登录窗口中,单击齿轮图标并选择 Ubuntu
  7. 登录到您的 Ubuntu 桌面。

4.6. 在 DGX OS Desktop 版本升级后仍使用旧 SSL 版本

描述

注意:此问题仅影响已从 DGX OS Desktop 3 版本升级的系统。它不影响在工厂预装或从 ISO 映像安装 DGX OS Desktop 4 版本的系统。

DGX OS Desktop 版本升级后,DGX OS Desktop 3 版本的安全套接字层 (SSL) 版本继续使用。

发生此问题的原因是,对于 DGX OS Desktop 3 版本,安装了两个版本的 SSL

  • 自定义版本的 LibreSSL 安装在 /usr/local/bin/openssl 中。
  • 标准 Ubuntu 版本的 OpenSSL 安装在 /usr/bin/openssl 中。

自定义版本的 LibreSSL 在 DGX OS Desktop 版本升级期间不会删除。但是,由于 $PATH 变量为 DGX OS Desktop 定义的方式,/usr/local/bin 中的版本优先。

DGX OS Desktop 4 版本中,不再需要为 DGX OS Desktop 3 版本制作的 LibreSSL 自定义项。为了确保您正在使用正在积极维护的 SSL 版本,请使用标准 Ubuntu 版本的 OpenSSL。

影响版本

DGX OS Desktop 3 版本升级到的任何 DGX OS Desktop 4 版本。

解决方法

此解决方法需要管理员权限。

  1. 确认您仍在使用的 LibreSSL。

    # openssl version
    LibreSSL 2.5.4
  2. 删除 LibreSSL。

    # sudo rm -f /usr/local/bin/openssl
  3. 在一个新的 shell 窗口中,确认您现在正在使用 OpenSSL。

    # openssl version
    OpenSSL 1.1.0g  2 Nov 2017

4.7. 在 DGX OS Desktop 版本升级后 NVIDIA 桌面快捷方式未更新

描述

DGX OS Desktop 4 版本中,NVIDIA 桌面快捷方式已更新,以反映有关 NVIDIA DGX 系统和深度学习框架容器的最新信息。这些桌面快捷方式也组织在桌面上的单个文件夹中。

DGX OS Desktop 版本升级后,现有用户的 NVIDIA 桌面快捷方式不会更新。但是,在升级后添加的用户的桌面将在单个文件夹中包含当前的桌面快捷方式。

影响版本

4.0.4 到 4.14.0

解决方法

如果您想从桌面快速访问有关 NVIDIA DGX 系统和容器的最新信息,请将旧的桌面快捷方式替换为新的桌面快捷方式。

  1. 更改到您的桌面目录。

    $ cd /home/your-user-login-id/Desktop
  2. 删除现有的 NVIDIA 桌面快捷方式。

    $ rm dgx-container-registry.desktop \
    dgxstation-userguide.desktop \
    dgx-container-registry-userguide.desktop \
    nvidia-customer-support.desktop
  3. 将包含新 NVIDIA 桌面快捷方式的文件夹及其内容复制到您的桌面目录。

    $ cp -rf /etc/skel/Desktop/Getting\ Started/ .

4.8. 连接三个显示器时显示器唤醒失败

描述

在连接了三个显示器的 DGX Station 中,当系统空闲时,显示器在休眠后无法唤醒。当您通过按键盘上的键唤醒显示器后登录时,会出现一个错误对话框,显示以下消息

Could not switch the monitor configuration

影响版本

3.1.8

解决方法

此解决方法需要 sudo 权限和从另一台计算机通过安全 shell (SSH) 远程访问 DGX Station

  1. 从另一台计算机,通过 SSH 以具有 sudo 权限的用户身份登录到 DGX Station

  2. 从您登录的计算机,停止并重新启动 X Window System 显示管理器。

    1. 停止 X Window System 显示管理器。

      # sudo pkill X
    2. 重新启动 X Window System 显示管理器。

      # sudo service lightdm start
  3. DGX Station,阻止显示器在系统空闲时休眠。

    1. 从桌面菜单栏右侧的 Ubuntu 系统菜单 中,选择 系统设置,然后在打开的 系统设置 窗口中,单击 亮度与锁定

    2. 在打开的 亮度与锁定 窗口中,将 当不活动时关闭屏幕 设置为 从不,然后单击 应用

4.9. Vino VNC 服务器在自动登录时启动问题

描述

如果您已使用默认的 Ubuntu Desktop OS 功能来启用屏幕共享,并且您的帐户设置为自动登录,则您无法通过 VNC 客户端远程访问 DGX Station 上的桌面会话。如果您在自动登录后尝试远程访问桌面会话,则 VNC 客户端上的显示为空白。

发生此问题的原因是,当 DGX Station 启动时,Vino VNC 服务器未自动启动。Vino VNC 服务器进程 vino-server 仅在您通过登录屏幕手动登录时运行。vino-server 进程在您在 DGX Station 启动时自动登录的情况下不会启动。

影响版本

4.0.4 到 4.14.0

解决方案

plymouth 软件包升级到版本 0.9.3-1ubuntu7.18.04.2 或更高版本。

4.10. 在 DGX OS Desktop 安装后出现错误的 Failed to finalize file systems 错误

描述

当系统在从 ISO 映像安装 DGX OS Desktop 后首次重新启动时,会错误地显示以下消息

Failed to finalize file systems

如果您在从 ISO 映像安装 DGX OS Desktop 后的首次重新启动期间看到此消息,请忽略该消息。

影响版本

3.1.8

解决方法

无需任何操作。

4.11. 间歇性更新 dgxstation-grub 软件包失败

描述

在更新 DGX OS Desktop 软件期间,EFI 启动记录可能变为不可写,从而阻止 dgxstation-grub 软件包更新。当发生此错误时,将显示以下错误消息

efibootmgr: Could not set variable Boot0008: No such file or directory
efibootmgr: Could not prepare boot variable: No such file or directory

影响版本

4.0.4 到 4.14.0

3.1.4 到 3.1.8

解决方法

此解决方法需要管理员权限。

  1. 重新启动 DGX Station

    $ sudo reboot
  2. 安装 dgxstation-grub 软件包。

    $ sudo apt install -y dgxstation-grub

4.12. 无法从恢复菜单启用网络连接

描述

在恢复模式下,当从恢复菜单中选择网络时,命令失败,并显示以下错误

/etc/resolv.conf: No such file or directory

已在版本中解决

4.4.0

影响版本

4.0.4 到 4.3.0

3.1.1 到 3.1.8

解决方法

  1. 在恢复模式下启动 DGX Station
  2. 恢复菜单中,选择root以进入 root shell。
  3. 在 root shell 中,重新配置 resolvconf 软件包。
    dpkg-reconfigure resolvconf

网络现在已启用。

4.13. 文件复制错误导致软件映像安装失败

描述

将文件复制到 OS SSD 中的随机错误可能会导致 DGX OS Desktop 软件映像安装失败。

影响版本

4.0.4 到 4.14.0

3.1.1 到 3.1.8

解决方法

重新启动 DGX Station 并重试。

4.14. 缺少根文件系统导致软件映像安装失败

描述

DGX OS Desktop 软件映像安装可能会失败,并显示错误 No root file system is defined。如果以前在 DGX Station 上安装了自定义软件映像,并且设备 sda 已配置为 RAID 阵列的一部分,则可能会发生此错误。DGX OS Desktop 软件映像的安装要求设备 sda 必须可用作 OS 驱动器。

影响版本

4.0.4 到 4.14.0

3.1.1 到 3.1.8

解决方法

重新配置设备 sda 以使其可用作 OS 驱动器,然后重试。

5. 已解决问题

5.1. NVIDIA Visual Profiler 和 Nsight Eclipse Edition 启动失败

描述

NVIDIA Visual Profiler 和 Nsight Eclipse Edition 需要比 DGX OS Desktop 中的默认版本更早版本的 Java 运行时环境 (JRE)。如果您尝试在不指定所需 JRE 版本的情况下运行 NVIDIA Visual Profiler 或 Nsight Eclipse Edition,则启动将失败。

这些应用程序还需要 libcanberra-gtk-module 软件包,该软件包未包含在 DGX OS Desktop 4 版本中。如果任何应用程序在没有此软件包的情况下启动,则会显示以下错误消息

Gtk-Message: 17:34:33.117: Failed to load module "canberra-gtk-module"

已在版本中解决

4.4.0

影响版本

4.0.4 到 4.3.0

解决方法

如果您想使用 NVIDIA Visual Profiler 或 Nsight Eclipse Edition,请在安装或升级到 DGX OS Desktop 4 版本(例如 4.0.4)后安装 libcanberra-gtk-module 软件包。

# sudo apt install libcanberra-gtk-module

每次启动 NVIDIA Visual Profiler 或 Nsight Eclipse Edition 时,都必须指定所需的 JRE 版本。由于 DGX OS Desktop 已经包含所需的 JRE 版本,因此您只需在启动 NVIDIA Visual Profiler 或 Nsight Eclipse Edition 的命令中包含 -vm /usr/lib/jvm/java-8-openjdk-amd64/jre/bin/java 选项

  • $ nvvp -vm /usr/lib/jvm/java-8-openjdk-amd64/jre/bin/java
  • $ nsight -vm /usr/lib/jvm/java-8-openjdk-amd64/jre/bin/java

5.2. 更新到 Linux 内核后 UDP 网络性能下降

描述

包含 Linux 内核更新的 DGX OS Desktop 更新可能会导致从 DGX Station 到远程系统的 UDP 数据传输工作负载的网络性能降低。

已在版本中解决

4.4.0

性能降低是 CPU 推测性侧信道漏洞缓解措施的结果。解决此问题涉及禁用这些缓解措施,如 中所述。

影响版本

任何运行 Linux 内核版本 4.4.0-116 的 DGX OS Desktop 版本

5.3. nvhealth 输出中不正确的序列号

描述

nvhealth 命令错误地将主板的序列号列在 检查 下的 DGX 序列号 条目中。正确的序列号列在 系统摘要 下。

$ sudo nvhealth
Info
----
Timestamp:  Thu Mar  7 08:54:52 2019 -0800
Version:    19.01.6

Checks
------
DGX BaseOS Version [4.0.5]...........................................
BIOS Version [0406]..................................................
DGX Serial Number [160984157800056]..................................
...

System Summary
--------------
    Product Name: DGX Station
    Manufacturer: NVIDIA
    DGX Serial Number: 0154017000004
    Uptime: up 5 days, 17 hours, 44 minutes
Motherboard:
    BIOS Version: 0406
    Serial Number: 160984157800056
...

已在版本中解决

4.4.0

此问题已在 NVIDIA 系统管理 (NVSM) 中解决,NVSM 在版本 4.4.0 中取代了 nvhealth

影响版本

4.0.4 到 4.3.0

3.1.1 到 3.1.8

5.4. DGX Station 启动时以太网连接失败

描述

DGX Station 启动或重新启动时,以太网接口可能未针对动态主机配置协议 (DHCP) 正确配置。因此,DGX Station 无法连接到 Internet,并且其网络端口的状态为 unmanaged。Docker 接口不受影响。

已在版本中解决

3.1.3

影响版本

3.1.2, 3.1.1

解决方法

此解决方法需要 sudo 权限。

  1. 在纯文本编辑器(如 vi)中打开文件 /etc/network/interfaces 进行编辑。
    $ sudo vi /etc/network/interfaces
  2. 从文件中删除以下行
    auto enp2s0f0
    iface enp2s0f0 inet manual
    
    auto enp2s0f1
    iface enp2s0f1 inet manual
  3. 保存并关闭文件。
  4. 使用 DHCP 配置 DGX Station 以太网接口。
    $ sudo dhclient

5.5. CUDA 应用程序的待机和恢复问题

描述

NVIDIA 驱动程序在 CUDA 应用程序运行时存在已知的挂起和恢复问题。当 CUDA 应用程序运行时挂起系统可能会导致应用程序崩溃。在挂起-恢复周期后运行某些 CUDA 应用程序可能会导致系统不稳定。

为了解决 Docker 容器中运行的 CUDA 应用程序的这些问题,系统电源管理脚本已更新为在挂起-恢复周期期间停止和启动 nvidia-docker 插件。nvidia-docker 插件是 Docker 容器引擎的插件,为容器提供 GPU 驱动程序和 CUDA 功能。

注意:请勿在系统正在进行 DL 工作负载时挂起系统,并期望系统能正常恢复。

已在版本中解决

3.1.2

影响版本

3.1.1