安装 Red Hat Enterprise Linux#

Red Hat 提供了几种安装 Red Hat Enterprise Linux 的方法,如执行标准 RHEL 9 安装中所述。

本主题中的安装说明适用于最新版本的适用于 Red Hat Enterprise Linux 9 的 DGX 软件。DGX 软件不包括扩展更新支持 (EUS),EUS 是 Red Hat Enterprise Linux 的可选订阅。有关 EUS 的更多信息,请参阅Red Hat Enterprise Linux (RHEL) 扩展更新支持 (EUS) 概述

为了方便起见,本主题介绍了如何使用快速安装方法安装 Red Hat Enterprise Linux,并说明了在此过程中何时回收磁盘空间。它描述了一个最小安装。如果您有首选的 Red Hat Enterprise Linux 安装方法,则可以跳过本节,但请务必回收现有 Ubuntu 安装占用的磁盘空间。

此处描述的交互式方法使用连接的显示器和键盘以及带有 ISO 映像的 USB 驱动器,或通过 BMC 的远程控制台远程在 DGX 上安装 Red Hat Enterprise Linux。

重要提示

请参阅发行说明,以获取有关支持的版本或依赖项的任何重要信息。您还将找到经过认证和测试可与 DGX 软件一起使用的 Red Hat Enterprise Linux 版本。

获取 Red Hat Enterprise Linux#

获取 Red Hat Enterprise Linux 9 ISO 映像并存储在本地磁盘上,或创建格式化为 UEFI 的启动 USB 驱动器。请参阅下载 Red Hat Enterprise Linux以获取说明。

本地启动 Red Hat Enterprise Linux ISO#

  1. 将包含 Red Hat Enterprise Linux 9 ISO 映像的 USB 闪存驱动器插入 DGX。

  2. 将显示器和键盘直接连接到 DGX。

  3. 启动系统并在出现 NVIDIA 徽标时按 F11 进入启动菜单。

  4. 选择与插入的 USB 闪存驱动器对应的 USB 卷名称,并从中启动系统。

  5. 按照安装和配置 Red Hat Enterprise Linux中的说明进行操作

远程启动 Red Hat Enterprise Linux ISO#

本章介绍了使用 BMC 远程启动 Red Hat Enterprise Linux ISO 的步骤

如果您使用显示器和键盘进行本地安装,或者如果您在 DGX Station 上安装,请跳过本章。DGX Station 不能远程启动。

在 DGX-2、DGX A100、DGX A800 或 DGX H100/H200 上远程启动 ISO 映像#

  1. 连接到 BMC 并确保设置了所需的用户权限。

    1. 在 LAN 内打开浏览器并转到 https://<BMC-ip-address>/,然后登录。

    2. 从左侧菜单中,单击“设置”,然后选择“用户管理”。

    3. 单击带有您为 BMC 创建的用户名的卡片。

    4. 在“用户管理配置”对话框中,确保选中“VMedia 访问”复选框,然后单击“保存”。

      _images/bmc-dgx2-user-access.png
  2. 将 ISO 映像设置为虚拟媒体。

    1. 从左侧菜单中,单击“远程控制”。

      _images/bmc-dgxa100-remote-control.png
    2. 选择“启动 KVM”。

      _images/bmc-launch-kvm-dgxa100.png
    3. 在 KVM 窗口的顶部菜单栏中,单击“浏览文件”并选择 ISO 映像,然后单击“启动媒体”。

      _images/bmc-dgx2-start-media.png

      现在应该已连接 CD 映像。

      _images/bmc-dgx2-media-connected.png
    4. 在 KVM 窗口的顶部菜单栏中,单击“电源”,然后选择“重置服务器”。

  3. 从虚拟媒体启动。

    通常,默认启动顺序不会启动 CDROM 映像。您可以在 BIOS 中或作为启动菜单中的一次性选项更改此设置。

    1. 要调出启动菜单,请在启动过程的开始时按 F11

      按下 F11 将在进入启动菜单之前在虚拟显示中显示“Entering Boot Menu”。

      _images/dgx2-boot-screen.png
    2. 在启动菜单中,选择“UEFI: AMI Virtual CDROM0 1.00”作为启动设备,然后按 ENTER

      _images/dgxa100-sbios-select-boot-device.png

      如果您从 DGX-2 启动,则启动设备标记为“UEFI: Virtual CDROM0 1.00”。

      _images/dgx-2-sbios-select-boot-device.png
    3. 按照安装和配置 Red Hat Enterprise Linux中的说明进行操作

在 DGX-1 上远程启动 ISO 映像#

  1. 连接到 BMC 并更改用户权限。

    1. 在 LAN 内打开启用 Java 的 Web 浏览器并转到 http://<BMC-ip-address>/,然后登录。

      使用 Firefox 或 Internet Explorer。BMC 不正式支持 Google Chrome。

    2. 在顶部菜单中,单击“配置”,然后选择“用户”。

    3. 选择您为 BMC 创建的用户名,然后单击“修改用户”。

    4. 在“修改用户”对话框中,选中“VMedia”复选框以将其添加到用户的扩展权限,然后单击“修改”。

      _images/bmc-modify-user.png
  2. 将 ISO 映像设置为虚拟媒体并重新启动系统。

    1. 在顶部菜单中,单击“远程控制”,然后选择“远程 KVM”。

      _images/console-redirection.jpg
    2. 单击“启动 KVM”以打开远程控制台。

    3. 在 KVM 窗口的顶部菜单栏中,单击“浏览文件”并选择 ISO 映像,然后单击“启动媒体”。

      _images/bmc-dgx2-start-media.png

      现在应该已连接 CD 映像。

      _images/bmc-dgx2-media-connected.png
    4. 在 KVM 窗口的顶部菜单栏中,单击“电源”,然后选择“重置服务器”。

  3. 启动 CD ROM 映像。

    默认启动顺序不会启动 CDROM 映像。可以在 BIOS 中或作为启动菜单中的一次性选项更改此设置。要调出启动菜单,请在启动过程的开始时按 F11。按下 F11 将在进入启动菜单之前在虚拟显示的顶部显示“Show Boot Options”。如果按物理键没有效果,请使用“软”键盘(菜单 → 键盘布局 → 软键盘 → <语言>)调出虚拟键盘。

    _images/nv-splash-screen.png
    1. 在启动菜单中,选择“UEFI: AMI Virtual CDROM 1.00”作为启动设备,然后按 ENTER

      _images/select-boot-device.png
    2. 按照安装和配置 Red Hat Enterprise Linux中的说明进行操作

安装和配置 Red Hat Enterprise Linux#

本节假定您已启动 Red Hat Enterprise Linux ISO 映像。

注意

Rocky Linux:安装 Rocky Linux 的过程与此处描述的过程基本相同,除非另有说明。启动安装屏幕将引用 Rocky Linux 而不是 Red Hat Enterprise Linux,并且 Rocky Linux 的快速启动安装程序基于 Red Hat Enterprise Linux 安装程序,因此外观相似,只是名称不同。

  1. 启动 ISO 映像后,将显示安装程序的 GRUB 菜单。

    _images/install-rhel.png
  2. 如果您希望使用 kickstart 文件自动化安装,请参阅使用 Kickstart 安装部分

  3. 选择 Install Red Hat Enterprise Linux 并按“e”编辑选定的选项。

    1. 添加“nomodeset”参数,如下所示。

      “nomodeset”阻止加载内置 Nouveau 驱动程序,因为它可能无法正确支持 DGX 系统中使用的 GPU,从而导致显示问题。

      _images/install-rhel-params-dgx-station.png
    2. 按 Ctrl-x 保存更改并开始安装。

  4. 请参阅执行标准 RHEL 9 安装,以获取有关使用 RHEL 9 安装程序的其他指导。

  5. 从“安装摘要”屏幕配置语言、区域、日期、时间、键盘以及您可能需要的其他配置选项。

  6. 将“软件选择”设置为正确的值。

    • 对于 DGX Station 和 DGX Station A100:设置为“带 GUI 的服务器”。

    • 对于 DGX 服务器(DGX 1-1、DGX-2、DGX A100、DGX A800 和 DGX H100/H200):设置为“最小安装”。

    注意

    设置正确的“软件选择”对于正常运行至关重要。

    _images/rhel8-installation-summary.png
  7. 根据平台以及是否要使用加密来分区磁盘

    如果您无法删除现有分区,请参阅Red Hat 安装程序无法删除分区

  8. 配置以太网。

    从“网络和主机名”部分,选择并启用以太网设备。这默认为 DHCP,可以在“配置”下更改为静态 IP 配置。

    _images/network-host-name.png
  9. 在“安装摘要”屏幕中,设置您的密码(在“用户设置”>“Root 密码”中)并创建一个新用户(在“用户设置”>“用户创建”中),然后单击“开始安装”以开始安装。

    _images/rhel8-install-summ-destination.png

    当系统重新启动时,请务必弹出任何仍然安装的安装光盘。

  10. 完成初始 Red Hat Enterprise Linux 设置。

    • 如果您使用“带 GUI 的服务器”基本环境安装,则初始设置会自动启动,您可以在其中接受许可协议并注册系统。请参阅Red Hat 说明以了解详细信息。

    • 如果您使用 CentOS,则需要接受许可协议。

    • 如果您使用任何其他基本环境安装,请以 root 用户身份登录系统,然后注册系统。

      subscription-manager register --auto-attach --username=user_name --password=password
      
    • 为了防止意外升级 Linux 内核,例如从 RHEL 9.3 升级到 9.4,当该内核的预编译 GPU 模块和驱动程序不可用时,您应该通过设置 release 命令的 --set=<release> 选项来固定所需的 RHEL 版本。

      例如,要停留在 RHEL 9.3 版本

      subscription-manager release --set=9.3
      

      您应该查看发行说明部分,了解 GPU 驱动程序和 Linux 内核支持,然后再更改 –set=<release> 设置并执行 sudo dnf update –-nobest

请参阅如何使用 Red Hat Subscription-Manager 在 Red Hat 客户门户网站注册和订阅系统以获取更多信息。

分区#

本章提供了有关分区 DGX 系统的说明

DGX-1、DGX Station 和 DGX Station A100 的磁盘分区#

注意

以下部分的屏幕截图取自 DGX-1。DGX Station 和 DGX Station A100 安装的屏幕可能会显示略有不同的信息,例如磁盘大小、可用磁盘空间、接口名称等等。

  1. 在“安装目标”屏幕上,选择较小的可用驱动器进行安装。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0001.png

    在“存储配置”下,单击“自定义”单选按钮,然后单击“完成”。

    这将打开“手动分区”窗口。

  2. 展开您选择的设备的下拉菜单,并删除所有现有分区,直到没有剩余分区。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0011.png
  3. 单击左下角的“+”按钮创建新分区。

    创建大小为 512 MiB 的 /boot/efi 分区。

    _images/rhel8-install-dest-dgx-2-a100_page_0021.png
  4. 为“设备类型”选择“标准分区”。

    _images/rhel8-install-dest-dgx-2-a100_page_0031.png

    在“设备”下,确保仅选择您在步骤 1 中选择的驱动器。单击“更新设置”以确认您的更改。

  5. 再次单击左下角的“+”按钮以创建另一个新分区。创建 / 分区,这次将“所需容量”字段留空。这让安装程序知道使用磁盘的剩余容量。

    _images/rhel8-install-dest-dgx-2-a100_page_0041.png
  6. 对于 / 分区,再次为“设备类型”选择“标准分区”。在“设备”下,确保仅选择您在步骤 1 中选择的驱动器。对于“文件系统”,选择“XFS”。

    _images/rhel8-install-dest-dgx-2-a100_page_0051.png

    在“设备”下,确保仅选择您在步骤 1 中选择的驱动器。对于“文件系统”,选择“XFS”。单击“更新设置”以确认您的更改。

  7. 单击“完成”。这会导致底部出现黄色警告栏,因为尚未创建交换分区。

  8. 再次单击“完成”,然后单击“接受更改”以将我们所有的自定义设置写入磁盘。

    _images/rhel8-install-dest-dgx-2-a100_page_0071.png
  9. 返回到安装和配置 Red Hat Enterprise Linux部分的步骤 8。

DGX-1、DGX Station 和 DGX Station A100 的加密磁盘分区#

注意

以下部分的屏幕截图取自 DGX-1。DGX Station 和 DGX Station A100 安装的屏幕可能会显示略有不同的信息,例如磁盘大小、可用磁盘空间、接口名称等。

  1. 在“安装目标”屏幕上,选择较小的可用驱动器进行安装。在“存储配置”下,单击“自定义”单选按钮,然后单击“完成”。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0001.png
  2. 这将打开“手动分区”窗口。展开您选择的设备的下拉菜单,并删除所有现有分区,直到没有剩余分区。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0011.png
  3. 单击左下角的“+”按钮创建新分区。

    创建大小为 512 MiB 的 /boot/efi 分区。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0021.png
  4. 为“设备类型”选择“标准分区”。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0031.png

    在“设备”下,确保仅选择您在步骤 1 中选择的驱动器。

    单击“更新设置”以确认您的更改。

  5. 再次单击左下角的“+”按钮以创建另一个新分区。

    创建大小为 2 GiB 的 /boot 分区。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0041.png
  6. 对于 /boot 分区,再次为“设备类型”选择“标准分区”。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0051.png

    在“设备”下,确保仅选择您在步骤 1 中选择的驱动器。对于“文件系统”,选择“XFS”。

    单击“更新设置”以确认您的更改。

  7. 再次单击左下角的“+”按钮以创建另一个新分区。

    创建 / 分区,这次将“所需容量”字段留空。这让安装程序知道使用磁盘的剩余容量。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0071.png
  8. 对于 / 分区,再次为“设备类型”选择“标准分区”。务必选中“加密”复选框,并为“LUKS 版本”选择“luks2”。对于“文件系统”,选择“XFS”。再次确认此分区使用您在步骤 2 中选择的两个设备。然后单击“完成”。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0081.png
  9. 现在将出现提示,询问 LUKS 密码。请务必选择一个强且安全的密码。两次输入密码后,单击“保存密码短语

  10. 单击“完成”。这会导致底部出现黄色警告栏,因为尚未创建交换分区。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0091.png
  11. 再次单击“完成”,然后单击“接受更改”以将我们所有的自定义设置写入磁盘。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0101.png
  12. 返回到安装和配置 Red Hat Enterprise Linux部分的步骤 8。

DGX-2、DGX A100、DGX A800 和 DGX H100/H200 的磁盘分区#

注意

以下部分的屏幕截图取自 DGX A100。DGX-2、DGX H100/H200 和 DGX A800 安装的说明可能会显示略有不同的信息,例如磁盘大小、可用磁盘空间、接口名称等等。

  1. 在“安装目标”屏幕上,选择较小的可用驱动器进行安装。

    在“存储配置”下,单击“自定义”单选按钮,然后单击“完成”。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0001.png

    这将打开“手动分区”窗口。

  2. 展开您选择的设备的下拉菜单,并删除所有现有分区,直到没有剩余分区。

    _images/rhel8-install-dest-dgx-2-a100_page_0011.png
  3. 单击左下角的“+”按钮创建新分区。

    创建大小为 512 MiB 的 /boot/efi 分区。

    _images/rhel8-install-dest-dgx-2-a100_page_0021.png
  4. 将“设备类型”更改为“RAID”,将“RAID 级别”更改为“RAID1”,并通过单击“设备(s)”部分中的“修改”并确保仍选中两个磁盘来确认此分区覆盖了您在步骤 2 中选择的两个设备。

    请注意,左侧的分区信息可能尚未反映两个设备。单击“更新设置”以确认您的更改。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0031.png
  5. 再次单击左下角的“+”按钮以创建另一个新分区。

    创建 / 分区,这次将“所需容量”字段留空。这让安装程序知道使用磁盘的剩余容量。

    _images/rhel8-install-dest-dgx-2-a100_page_0041.png
  6. 对于 / 分区,再次为“设备类型”选择“RAID”,为“RAID 级别”选择“RAID1”。对于“文件系统”,选择“XFS”。

    通过单击“设备(s)”部分中的“修改”并确保仍选中两个磁盘来确认此分区使用您在步骤 2 中选择的两个设备。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0051.png
  7. 单击“完成”。

    这会导致底部出现黄色警告栏,因为尚未创建交换分区。

  8. 再次单击“完成”,然后单击“接受更改”以将我们所有的自定义设置写入磁盘。

    _images/rhel8-install-dest-dgx-2-a100_page_0101.png
  9. 返回到安装和配置 Red Hat Enterprise Linux部分的步骤 8。

DGX-2、DGX A100、DGX A800 和 DGX H100/H200 的加密磁盘分区#

注意

以下部分的屏幕截图取自 DGX A100。以下说明将使用 LUKS 在您的启动设备上创建加密的根文件系统。这与使用自加密数据驱动器是不同的过程。

  1. 在“安装目标”屏幕上,选择较小的可用驱动器进行安装。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0001.png

    在“存储配置”下,单击“自定义”单选按钮,然后单击“完成”。

    这将打开“手动分区”窗口。

  2. 展开您选择的设备的下拉菜单,并删除所有现有分区,直到没有剩余分区。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0011.png
  3. 单击左下角的“+”按钮创建新分区。

    创建大小为 512 MiB 的 /boot/efi分区。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0021.png
  4. 将“设备类型”更改为“RAID”,将“RAID 级别”更改为“RAID1”,并通过单击“设备(s)”部分中的“修改”并确保仍选中两个磁盘来确认此分区覆盖了您在步骤 2 中选择的两个设备。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0031.png

    请注意,左侧的分区信息可能尚未反映两个设备。

    单击“更新设置”以确认您的更改,并验证显示的 /boot/efi 分区是否列出了分区名称而不是单个设备。

  5. 再次单击左下角的“+”按钮以创建另一个新分区。

    创建大小为 2 GiB 的 /boot 分区。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0041.png
  6. 对于 /boot 分区,再次为“设备类型”选择“RAID”,为“RAID 级别”选择“RAID1”。

    对于“文件系统”,选择“XFS”。

    _images/rhel8-install-dest-dgx-2-a100_page_0051.png

    再次通过单击“设备(s)”部分中的“修改”并确保仍选中两个磁盘来确认此分区使用您在步骤 2 中选择的两个设备。

    单击“更新设置”以确认您的更改。再次单击左下角的“+”按钮以创建另一个新分区。

    创建 / 分区,这次将“所需容量”字段留空。这让安装程序知道使用磁盘的剩余容量。

  7. 对于 / 分区,再次为“设备类型”选择“RAID”,为“RAID 级别”选择“RAID1”。

    务必选中“加密”复选框,并为“LUKS 版本”选择“luks2”。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0071.png

    对于“文件系统”,选择“XFS”。再次确认此分区使用您在步骤 2 中选择的两个设备。

    单击“更新设置”以确认您的更改,然后单击“完成”以开始退出分区菜单。

    现在将出现提示,询问 LUKS 密码。

  8. 请务必选择一个强且安全的密码。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0081.png

    两次输入密码后,单击“保存密码短语”。

  9. 单击“完成”。

    这会导致底部出现黄色警告栏,因为尚未创建交换分区。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0091.png
  10. 再次单击“完成”,然后单击“接受更改”以将我们所有的自定义设置写入磁盘。

    _images/rhel8-install-dest-dgx-2-a100-encrypt_page_0101.png
  11. 返回到安装和配置 Red Hat Enterprise Linux部分的步骤 8。