安装 Red Hat Enterprise Linux

有几种方法可以安装 Red Hat Enterprise Linux,如《Red Hat Enterprise Linux 安装指南》中所述。

有关经过认证和测试可与 DGX 软件配合使用的 Linux 发行版,请参阅《DGX 软件 for Red Hat Enterprise Linux 发行说明》

为方便起见,本节介绍如何使用快速安装方法安装 Red Hat Enterprise Linux,并说明在此过程中何时回收磁盘空间。它描述了最小化安装。如果您有首选的 Red Hat Enterprise Linux 安装方法,则可以跳过本节,但请务必回收现有 Ubuntu 安装占用的磁盘空间。

此处描述的交互式方法通过连接的显示器和键盘以及带有 ISO 镜像的 USB 闪存驱动器,或通过 BMC 的远程控制台在 DGX 上安装 Red Hat Enterprise Linux

获取 Red Hat Enterprise Linux

获取 Red Hat Enterprise Linux ISO 镜像并将其存储在本地磁盘上,或创建为 UEFI 格式化的启动 USB 驱动器。有关说明,请参阅《下载 Red Hat Enterprise Linux》

本地启动 Red Hat Enterprise Linux ISO 镜像

  1. 将包含 Red Hat Enterprise Linux ISO 镜像的 USB 闪存驱动器插入 DGX。
  2. 将显示器和键盘直接连接到 DGX。
  3. 启动系统,并在出现 NVIDIA 徽标时按 F11 进入启动菜单。
  4. 选择与插入的 USB 闪存驱动器对应的 UEFI 卷名,并从中启动系统。
  5. 按照安装 Red Hat Enterprise Linux中的说明进行操作

在 DGX-1、DGX-2 或 DGX A100 上远程启动 Red Hat Enterprise Linux ISO 镜像

如果您使用显示器和键盘进行本地安装,或者您在 DGX Station 上安装,请跳过本章。 DGX Station 无法远程启动

在 DGX-1 上远程启动 ISO 镜像

如果您使用显示器和键盘进行本地安装,请跳过本章。
  1. 连接到 BMC 并更改用户权限。
    1. 在您的局域网内打开启用 Java 的 Web 浏览器,然后转到 http://<BMC-ip-address>/,然后登录。

      使用 Firefox 或 Internet Explorer。Google Chrome 未获得 BMC 官方支持。

    2. 从顶部菜单中,单击配置,然后选择用户管理
    3. 选择您为 BMC 创建的用户名,然后单击修改用户
    4. 修改用户对话框中,选中VMedia复选框以将其添加到用户的扩展权限中,然后单击修改

  2. 将 ISO 镜像设置为虚拟介质并重启系统。
    1. 从顶部菜单中,单击远程控制,然后选择控制台重定向

    2. 单击Java 控制台以打开远程 JViewer 窗口。确保为此站点禁用弹出窗口阻止程序。
    3. 从 JViewer 顶部菜单栏中,单击介质,然后选择虚拟介质向导

    4. 在虚拟介质对话框的 CD/DVD 介质:I 部分中,单击浏览,然后找到系统上的 Red Hat Enterprise Linux ISO 文件,然后单击打开

      您可以忽略虚拟介质向导底部的设备重定向警告,因为它不会影响重镜像系统的能力。

    5. 单击连接 CD/DVD,然后单击信息对话框中的确定

      虚拟介质窗口显示 ISO 镜像已连接。

    6. 关闭窗口。菜单栏中的 CD-ROM 图标变为绿色,表示 ISO 镜像已附加。

    7. 从顶部菜单中,单击电源,然后选择重置服务器

    8. 在电源控制对话框中单击,然后单击确定,然后等待系统断电并重新上线。
  3. 启动 CD-ROM 镜像。

    通常,默认启动顺序不会启动 CDROM 镜像。可以在 BIOS 中或作为启动菜单中的一次性选项更改此设置。要调出启动菜单,请在启动过程开始时按 F11。按下 F11 将在进入启动菜单之前在虚拟显示器的顶部显示“显示启动选项”。如果按下物理按键没有效果,请使用“软键盘”(菜单 → 键盘布局 → 软键盘 → <语言>)调出虚拟键盘。

    1. 在启动菜单中,选择UEFI: AMI Virtual CDROM 1.00作为启动设备,然后按 回车

    2. 按照安装 Red Hat Enterprise Linux中的说明进行操作。

在 DGX-2 上远程启动 ISO 镜像

如果您使用显示器和键盘进行本地安装,请跳过本章。
  1. 连接到 BMC 并确保已设置所需的用户权限。
    1. 在您的局域网内打开浏览器,然后转到 https://<BMC-ip-address>/,然后登录。
    2. 从左侧菜单中,单击设置,然后选择用户管理
    3. 单击带有您为 BMC 创建的用户名的卡片。
    4. 用户管理配置对话框中,确保选中VMedia 访问复选框,然后单击保存

  2. 将 ISO 镜像设置为虚拟介质。
    1. 从左侧菜单中,单击远程控制

    2. 选择启动 KVM

    3. 在 KVM 窗口的顶部菜单栏中,单击浏览文件并选择 ISO 镜像,然后单击启动介质

      CD 镜像现在应该已连接。

    4. 在 KVM 窗口的顶部菜单栏中,单击电源,然后选择重置服务器
  3. 从虚拟介质启动。

    通常,默认启动顺序不会启动 CDROM 镜像。可以在 BIOS 中或作为启动菜单中的一次性选项更改此设置。

    1. 要调出启动菜单,请在启动过程开始时按 F11

      按下 F11 将在进入启动菜单之前在虚拟显示器中显示正在进入启动菜单

    2. 在启动菜单中,选择UEFI: Virtual CDROM 1.00作为启动设备,然后按 回车

    3. 按照安装 Red Hat Enterprise Linux中的说明进行操作

在 DGX A100 上远程启动 ISO 镜像

如果您使用显示器和键盘进行本地安装,请跳过本章。
  1. 连接到 BMC 并确保已设置所需的用户权限。
    1. 在您的局域网内打开浏览器,然后转到 https://<BMC-ip-address>/,然后登录。
    2. 从左侧菜单中,单击设置,然后选择用户管理
    3. 单击带有您为 BMC 创建的用户名的卡片。
    4. 用户管理配置对话框中,确保选中VMedia 访问复选框,然后单击保存

  2. 将 ISO 镜像设置为虚拟介质。
    1. 从左侧菜单中,单击远程控制

    2. 选择启动 KVM

    3. 在 KVM 窗口的顶部菜单栏中,单击浏览文件并选择 ISO 镜像,然后单击启动介质

      CD 镜像现在应该已连接。

    4. 在 KVM 窗口的顶部菜单栏中,单击电源,然后选择重置服务器
  3. 从虚拟介质启动。

    通常,默认启动顺序不会启动 CDROM 镜像。您可以在 BIOS 中或作为启动菜单中的一次性选项更改此设置。

    1. 要调出启动菜单,请在启动过程开始时按 F11

      按下 F11 将在进入启动菜单之前在虚拟显示器中显示正在进入启动菜单

    2. 在启动菜单中,选择UEFI: AMI Virtual CDROM 1.00作为启动设备,然后按 回车

    3. 按照安装 Red Hat Enterprise Linux中的说明进行操作

安装 Red Hat Enterprise Linux

在 DGX-1、DGX Station 或 DGX Station A100 上安装

本节假设您已启动 Red Hat Enterprise Linux ISO 镜像,无论是 DGX-1 的本地启动还是远程启动,还是 DGX Station 或 DGX Station A100 的本地启动

这些说明中的屏幕截图取自 DGX-1 系统。DGX Station 安装在磁盘大小、可用磁盘空间、接口名称等方面可能略有不同。

  1. 通过 BMC 或从 USB 驱动器启动 ISO 镜像后,开始安装。



    • 在 DGX-1 上:选择安装 Red Hat Enterprise Linux,然后按回车开始安装。

    • 在 DGX Station 上:更新 linuxefi 参数以防止加载 Red Hat Enterprise Linux 中的 Nouveau 驱动程序,然后开始安装。

      Nouveau 驱动程序无法正确支持 DGX Station 中的 GPU,这可能会导致显示问题。DGX Station 中的 GPU 需要安装驱动程序,如安装和加载 NVIDIA CUDA 驱动程序中所述。

      1. 选择安装 Red Hat Enterprise Linux,然后键入e

      2. nomodeset 选项附加到 linuxefi 参数。





      3. Ctrl+X 保存更改并开始安装。

    Red Hat Enterprise Linux 安装程序启动。

    有关使用安装程序的指南,请参阅《Red Hat Enterprise Linux 快速安装指南》

  2. 安装摘要屏幕配置您可能需要的语言、区域、日期、时间、键盘和其他配置选项。
  3. 选择要安装的软件包。

    有关详细说明,请参阅《Red Hat Enterprise Linux 安装指南》中的“软件选择”

  4. 软件选择设置为正确的值。
    • 对于 DGX Station 和 DGX Station A100:设置为带 GUI 的服务器
    • 对于 DGX 服务器(DGX 1-1、DGX-2、DGX A100):设置为最小化安装
    注意:设置正确的软件选择对于正常运行至关重要。







  5. 设置系统驱动器。

    此步骤将删除 Ubuntu 安装,以便为 Red Hat Enterprise Linux 安装回收空间。

    1. 从“安装摘要”屏幕中,单击安装目的地

    2. 安装目的地屏幕上,选择第一个驱动器 (sda) 作为安装驱动器。
    3. 其他存储选项下,单击我要配置分区单选按钮,然后单击完成
      注意:如果在 DGX Station 上安装软件,则本地标准磁盘的数量、其标签、容量以及显示的可用空间量可能与屏幕截图中显示的示例有所不同。

      将出现手动分区对话框。

    4. 展开您选择的设备的未知下拉菜单,选择一个分区,然后单击“-”按钮删除该分区。



      未知下拉列表中列出的其他现有分区重复操作,直到没有剩余分区。



    5. 创建新分区。单击左下角的“+”按钮,并设置以下字段:
      • 挂载点:/boot/efi
      • 所需容量:512 MiB
      • 设备类型:标准分区

      设备下,确保仅选择您选择的 sda 驱动器,然后单击更新设置以确认您的更改。

    6. 创建另一个分区。单击左下角的“+”按钮,并设置以下字段:
      • 挂载点:/
      • 所需容量:[留空以让安装程序知道使用磁盘的剩余容量]
      • 设备类型:标准分区
      • 文件系统:XFS

      设备下,确保仅选择您选择的 sda 驱动器,然后单击更新设置以确认您的更改。

    7. 完成后单击完成

      这将导致底部出现黄色警告栏,因为未创建交换分区。

      再次单击完成,然后单击接受更改以将所有自定义项写入磁盘。

  6. 配置以太网。

    选择并启用以太网设备。这默认为 DHCP,可以在“配置”下针对静态 IP 配置进行更改。

  7. 从“安装摘要”屏幕中,单击开始安装以启动安装。

    1. 在安装过程运行时,从“配置”屏幕设置您的密码(ROOT 密码)并创建一个新用户(用户创建)。
    2. 安装完成后,单击重启以重启系统。
      注意:如果您安装了 Red Hat Enterprise Linux 7.5 并且正在使用 BMC 远程控制台,请按照发行说明中“Red Hat Enterprise Linux 7.5 的 BMC 远程控制台黑屏”下的说明进行操作。
  8. 在 Red Hat Enterprise Customer Portal 中注册系统以完成初始设置。
    • 如果您使用“带 GUI 的服务器”基本环境进行安装,则初始设置会自动启动,您可以在其中接受许可协议并注册系统。有关详细信息,请参阅Red Hat 说明
    • 如果您使用任何其他基本环境进行安装,请以 root 用户身份登录系统,然后注册系统。
      subscription-manager register --auto-attach --username=user_name --password=password
    有关更多信息,请参阅《如何使用 Red Hat Subscription-Manager 在 Red Hat Customer Portal 中注册和订阅系统》

在 DGX-2 上安装

本节假设您已启动 Red Hat Enterprise Linux ISO 镜像,无论是本地启动还是远程启动。

  1. 通过 BMC 或从 USB 驱动器启动 ISO 镜像后,选择安装 Red Hat Enterprise Linux,然后按回车开始安装。

    Red Hat Enterprise Linux 安装程序启动。

    有关使用安装程序的指南,请参阅《Red Hat Enterprise Linux 快速安装指南》

  2. 从“安装摘要”屏幕配置您可能需要的语言、区域、日期、时间、键盘和其他配置选项。
  3. 选择要安装的软件包。

    有关详细说明,请参阅《Red Hat Enterprise Linux 安装指南》中的“软件选择”

  4. 软件选择设置为正确的值。
    • 对于 DGX Station 和 DGX Station A100:设置为带 GUI 的服务器
    • 对于 DGX 服务器(DGX 1-1、DGX-2、DGX A100):设置为最小化安装
    注意:设置正确的软件选择对于正常运行至关重要。





  5. 设置启动磁盘。

    DGX OS 在 DGX-2 出厂前已在工厂安装,它在两个 M.2 NVMe 启动磁盘上创建了一个 RAID-1 阵列。因此,在 DGX-2 上安装 RHEL 7 时,必须选择两个启动磁盘。

    1. 从“安装摘要”屏幕中,单击安装目的地

    2. 在“安装目的地”屏幕上,选择两个 M.2 磁盘(即 894.25 GB 的磁盘)和“我要配置分区”单选按钮,然后单击完成

      将出现“手动分区”窗口。

    3. 展开未知下拉菜单。

      这将显示 Red Hat Enterprise Linux 已识别的磁盘。它们将是
      • RAID-1 根分区 (ext4, 893 GB)、
      • 第一个 EFI 系统分区 (ESP) (nvme0n1p1, 512 MB) 以及
      • 第二个 ESP (nvme1n1p1, 512 MB)。
    4. 选择 ext4 分区并将其重新格式化为 xfs,然后将挂载点设置为“/”,并将其标记为“md0

    5. 单击更新设置
  6. 创建 EFI 分区。
    1. 选择 nvme0n1p1 分区并将其重新格式化为 EFI 系统分区,然后将挂载点设置为“/boot/efi”,并单击更新设置

      此时,您配置的两个分区将位于新的 Red Hat Enterprise Linux 安装下拉菜单下,而 nvme1n1p1 EFI 分区仍将位于未知下。我们无法创建第二个 ESP,因为 Red Hat Enterprise Linux 不允许您创建两个挂载到同一挂载点的分区,即 /boot/efi,即使它们位于不同的磁盘上。您可以在安装“DGX 系统管理”yum 组后复制 ESP,该组提供了一个工具来完成此操作。
    2. 单击完成屏幕底部会出现黄色突出显示的警告。

    3. 单击黄色突出显示的警告消息。将出现以下消息。

      出现此消息是因为出厂时的 DGX OS 已为根分区创建了 RAID 1 阵列,并复制了 EFI 系统分区。
    4. 关闭警告,然后按完成将出现分区步骤摘要。

    5. 单击接受更改以返回主“安装摘要”屏幕。

      “系统:安装目的地”选项上将不再有黄色警告图标。

  7. 配置以太网。

    选择并启用以太网设备。这默认为 DHCP,可以在配置下针对静态 IP 配置进行更改。

  8. 从“安装摘要”屏幕中,单击开始安装以启动安装。

    1. 在安装过程运行时,从“配置”屏幕设置您的密码(ROOT 密码)并创建一个新用户(用户创建)。
    2. 安装完成后,单击重启以重启系统。
      注意:如果您安装了 Red Hat Enterprise Linux 7.5 并且正在使用 BMC 远程控制台,请按照发行说明中“Red Hat Enterprise Linux 7.5 的 BMC 远程控制台黑屏”下的说明进行操作。
  9. 在 Red Hat Enterprise Customer Portal 中注册系统以完成初始设置。
    • 如果您使用“带 GUI 的服务器”基本环境进行安装,则初始设置会自动启动,您可以在其中接受许可协议并注册系统。有关详细信息,请参阅Red Hat 说明
    • 如果您使用任何其他基本环境进行安装,请以 root 用户身份登录系统,然后注册系统。
      subscription-manager register --auto-attach --username=user_name --password=password
    有关更多信息,请参阅《如何使用 Red Hat Subscription-Manager 在 Red Hat Customer Portal 中注册和订阅系统》

在 DGX A100 上安装

本节假设您已启动 Red Hat Enterprise Linux ISO 镜像,无论是本地启动还是远程启动。

有关适用于 DGX-1 和 DGX Station 的说明,请参阅《在 DGX-1、DGX Station 或 DGX Station A100 上安装》

有关适用于 DGX-2 的说明,请参阅《在 DGX-2 上安装》

  1. 通过 BMC 或从 USB 驱动器启动 ISO 镜像后,选择安装 Red Hat Enterprise Linux,然后按回车开始安装。

    Red Hat Enterprise Linux 安装程序启动。

    有关使用安装程序的指南,请参阅《Red Hat Enterprise Linux 快速安装指南》

  2. 安装摘要屏幕配置您可能需要的语言、区域、日期、时间、键盘和其他配置选项。
  3. 选择要安装的软件包。

    有关详细说明,请参阅《Red Hat Enterprise Linux 安装指南》中的“软件选择”

  4. 软件选择设置为正确的值。
    • 对于 DGX Station 和 DGX Station A100:设置为带 GUI 的服务器
    • 对于 DGX 服务器(DGX 1-1、DGX-2、DGX A100):设置为最小化安装
    注意:设置正确的软件选择对于正常运行至关重要。





  5. 设置启动磁盘。

    DGX OS 在 DGX A100 出厂前已在工厂安装,它在两个 M.2 NVMe 启动磁盘上创建了一个 RAID-1 阵列。因此,在 DGX A100 上安装 RHEL 7 时,必须选择两个启动磁盘。

    1. 从“安装摘要”屏幕中,单击安装目的地

    2. 在“安装目的地”屏幕上,选择两个 M.2 磁盘(即 DGX A100 上的 1788 GiB)和“我要配置分区”单选按钮,然后单击完成

      将出现“手动分区”窗口。

    3. 展开未知下拉菜单。

      这将显示 Red Hat Enterprise Linux 已识别的磁盘。它们将是
      • RAID-1 根分区 (ext4, 1787.87 GB)、
      • 第一个 EFI 系统分区 (ESP) (nvme3n1p1, 512 MB) 以及
      • 第二个 ESP (nvme2n1p1, 512 MB)。
    4. 选择 ext4 分区并将其重新格式化为 xfs,然后将挂载点设置为“/”,并将其标记为“md0

    5. 单击更新设置
  6. 创建 EFI 分区。
    1. 选择“未知”部分中的第二个 EFI 分区(DGX A100 上的 nvme2n1p1),将其重新格式化为 EFI 系统分区,然后将挂载点设置为“/boot/efi”,并单击更新设置

      此时,您配置的两个分区将位于新的 Red Hat Enterprise Linux 安装下拉菜单下,而 Ubuntu EFI 分区(DGX A100 上的 nvme3n1p1)将位于Ubuntu下。我们无法创建第二个 ESP,因为 Red Hat Enterprise Linux 不允许您创建两个挂载到同一挂载点的分区,即 /boot/efi,即使它们位于不同的磁盘上。您可以在安装“DGX 系统管理”yum 组后复制 ESP,该组提供了一个工具来完成此操作。
    2. 单击完成屏幕底部会出现黄色突出显示的警告。

    3. 单击黄色突出显示的警告消息。将出现以下消息。

      出现此消息是因为出厂时的 DGX OS 已为根分区创建了 RAID 1 阵列,并复制了 EFI 系统分区。
    4. 关闭警告,然后单击完成将出现分区步骤摘要。

    5. 单击接受更改以返回主“安装摘要”屏幕。

      “系统:安装目的地”选项上将不再有黄色警告图标。

  7. 配置以太网。

    选择并启用以太网设备。这默认为 DHCP,可以在配置下针对静态 IP 配置进行更改。此屏幕还允许您设置主机名。

  8. 从“安装摘要”屏幕中,单击开始安装以启动安装。

    1. 在安装过程运行时,从“配置”屏幕设置您的密码(ROOT 密码)并创建一个新用户(用户创建)。
    2. 安装完成后,单击重启以重启系统。
      注意:如果您安装了 Red Hat Enterprise Linux 7.5 并且正在使用 BMC 远程控制台,请按照发行说明中“Red Hat Enterprise Linux 7.5 的 BMC 远程控制台黑屏”下的说明进行操作。
  9. 在 Red Hat Enterprise Customer Portal 中注册系统以完成初始设置。
    • 如果您使用“带 GUI 的服务器”基本环境进行安装,则初始设置会自动启动,您可以在其中接受许可协议并注册系统。有关详细信息,请参阅Red Hat 说明
    • 如果您使用任何其他基本环境进行安装,请以 root 用户身份登录系统,然后注册系统。
      subscription-manager register --auto-attach --username=user_name --password=password
    有关更多信息,请参阅《如何使用 Red Hat Subscription-Manager 在 Red Hat Customer Portal 中注册和订阅系统》