安装 CentOS 8

安装 CentOS 有几种方法,如CentOS 安装指南中所述。

有关已通过 DGX 软件认证和测试的 Red Hat Enterprise Linux 8 版本,请参阅DGX Software for Red Hat Enterprise Linux Release Notes

为方便起见,本节介绍如何使用快速安装方法安装 CentOS 或 Rocky Linux,并说明在此过程中何时回收磁盘空间。它描述了一个最小化安装。如果您有首选的 CentOS 安装方法,则可以跳过本节,但请务必回收现有 Ubuntu 安装占用的磁盘空间。

此处描述的交互式方法使用连接的显示器和键盘以及带有 ISO 镜像的 USB 闪存盘,或者通过 BMC 的远程控制台在 DGX 上安装 CentOS

获取 CentOS 8

获取 CentOS 8 ISO 镜像并存储在本地磁盘上,或创建格式化为 UEFI 的启动 USB 驱动器。有关说明,请参阅 Downloading CentOS

对于 Rocky Linux 8,请访问 Downloading Rocky Linux.

重要提示: 请参阅发行说明,了解有关受支持版本或依赖项的任何关键信息。

本地启动 CentOS 8 ISO

  1. 将包含 CentOS 8 ISO 镜像的 USB 闪存驱动器插入 DGX。
  2. 将显示器和键盘直接连接到 DGX。
  3. 启动系统并在 NVIDIA 徽标出现时按 F11 进入启动菜单。
  4. 选择与插入的 USB 闪存驱动器对应的 USB 卷名,并从中启动系统。
  5. 按照 安装 CentOS 中的说明进行操作

远程启动 CentOS 8 ISO

如果您使用显示器和键盘进行本地安装,请跳过本章。如果您在 DGX Station 上进行安装,也不可能远程启动 ISO。

在 DGX-1 上远程启动 ISO 镜像

如果您使用显示器和键盘进行本地安装,请跳过本章。
  1. 连接到 BMC 并更改用户权限。
    1. 在您的 LAN 中打开支持 Java 的 Web 浏览器,然后转到 http://<BMC-ip-address>/,然后登录。

      使用 Firefox 或 Internet Explorer。BMC 官方不支持 Google Chrome。

    2. 从顶部菜单中,单击Configuration,然后选择Users
    3. 选择您为 BMC 创建的用户名,然后单击Modify User
    4. Modify User对话框中,选中VMedia复选框以将其添加到用户的扩展权限,然后单击Modify

  2. 将 ISO 镜像设置为虚拟介质并重新启动系统。
    1. 从顶部菜单中,单击Remote Control ,然后选择Remote KVM

    2. 单击Launch KVM以打开远程控制台。
    3. 从 KVM 窗口的顶部菜单栏中,单击Browse File,然后选择 ISO 镜像,然后单击Start Media

      CD 镜像现在应该已连接。

    4. 从 KVM 窗口的顶部菜单栏中,单击Power,然后选择Reset Server
  3. 启动 CD-ROM 镜像。

    通常,默认启动顺序不启动 CDROM 镜像。可以在 BIOS 中更改此设置,也可以在启动菜单中将其作为一次性选项进行更改。要调出启动菜单,请在启动过程开始时按 F11。按下 F11 将在进入启动菜单之前在虚拟显示器的顶部显示“Show Boot Options”。如果按下物理键没有效果,请使用“软”键盘(菜单 → 键盘布局 → SoftKeyboard → <语言>)调出虚拟键盘。

    1. 在启动菜单中,选择UEFI: AMI Virtual CDROM 1.00作为启动设备,然后按 ENTER

    2. 按照 安装 CentOS 中的说明进行操作。

DGX-2 或 DGX A100 上远程启动 ISO 镜像

如果您使用显示器和键盘进行本地安装,请跳过本章。
  1. 连接到 BMC 并确保设置了所需的用户权限。
    1. 在您的 LAN 中打开浏览器,然后转到 https://<BMC-ip-address>/,然后登录。
    2. 从左侧菜单中,单击Settings,然后选择User Management
    3. 单击带有您为 BMC 创建的用户名的卡片。
    4. User Management Configuration对话框中,确保选中VMedia Access复选框,然后单击Save

  2. 将 ISO 镜像设置为虚拟介质。
    1. 从左侧菜单中,单击Remote Control

    2. 选择Launch KVM

    3. 从 KVM 窗口的顶部菜单栏中,单击Browse File,然后选择 ISO 镜像,然后单击Start Media

      CD 镜像现在应该已连接。

    4. 从 KVM 窗口的顶部菜单栏中,单击Power,然后选择Reset Server
  3. 从虚拟介质启动。

    通常,默认启动顺序不启动 CDROM 镜像。您可以在 BIOS 中更改此设置,也可以在启动菜单中将其作为一次性选项进行更改。

    1. 要调出启动菜单,请在启动过程开始时按 F11

      按下 F11 将在进入启动菜单之前在虚拟显示器中显示Entering Boot Menu

    2. 在启动菜单中,选择UEFI: AMI Virtual CDROM0 1.00作为启动设备,然后按 ENTER

      如果您从 DGX-2 启动,则启动设备标记为UEFI: Virtual CDROM0 1.00

    3. 按照 安装 CentOS 中的说明进行操作

安装 CentOS

本节假定您已启动 CentOS ISO 镜像。对于 DGX Station,这只能本地执行;对于所有其他平台,这可以本地远程执行。

如果您希望使用 kickstart 文件自动化安装,请参阅使用 Kickstart 安装部分
  1. 启动 ISO 镜像后,将出现安装程序的 GRUB 菜单。

  2. 选择 Install Red Hat Enterprise Linux 并按“e”编辑所选选项。
    1. 添加“nomodeset”参数,如下所示。

      “nomodeset”可防止加载内置 Nouveau 驱动程序,因为它可能无法正确支持 DGX 系统中使用的 GPU,从而导致显示问题。

    2. Ctrl-x 保存更改并开始安装。
  3. 有关使用安装程序的指南,请参阅 CentOS 快速安装指南
  4. Installation Summary 屏幕配置语言、区域、日期、时间、键盘以及您可能需要的其他配置选项。
  5. Software Selection设置为正确的值。
    • 对于 DGX Station 和 DGX Station A100:设置为Server with GUI
    • 对于 DGX 服务器(DGX 1-1、DGX-2、DGX A100):设置为Minimal Install
    注意: 设置正确的软件选择对于正常运行至关重要。

  6. 根据平台以及您是否要使用加密来分区磁盘:
  7. 配置以太网。

    Network & Host Name部分,选择并启用以太网设备。这默认为 DHCP,可以在Configure下更改为静态 IP 配置。

  8. INSTALLATION SUMMARY屏幕,设置您的密码(在User Settings > Root Password下)并创建一个新用户(在User Settings > User Creation下),然后单击Begin installation开始安装。

    当系统重新启动时,请务必弹出任何仍然挂载的安装光盘。

  9. 完成初始 CentOS 设置。
    • 如果您使用Server with GUI基本环境进行安装,则初始设置会自动启动,您可以在其中接受许可协议并注册系统。有关详细信息,请参阅 Red Hat 说明
    • 如果您使用的是 CentOS,则需要接受许可协议。
    • 如果您使用任何其他基本环境安装,请以 root 用户身份登录系统,然后注册系统。
      subscription-manager register --auto-attach --username=user_name --password=password

使用 Kickstart 安装

使用 Kickstart 安装

Kickstart 提供了一种自动化安装过程的方法,通过提供一个文件,其中包含安装期间将提出的问题的答案。NVIDIA 在以下位置为所有受支持的平台提供 kickstart 模板

在这些文件中,有一些标签您必须替换为您站点特定的信息:语言、键盘、时区、主机名等。每个标签的格式为 <CHANGE_YOUR_xxxx>。这些标签必须替换为您自己的特定信息。

一旦您有了为您的安装定制的 kickstart 文件,请将该文件放在可以通过 NFS、FTP、HTTP 或 HTTPS 访问的位置。从安装介质启动后,当 grub 菜单出现时,按“e”编辑 grub 条目,就像通常添加“nomodeset”选项一样。除了“nomodeset”之外,还添加格式为“inst.ks=<URL>”的选项。例如:inst.ks=https://192.168.1.2/kickstart/dgx-a100-cfg.ks

最后,在使用这些 kickstart 文件后,请记住最后一次重新启动系统以应用所有设置。

有关将 kickstart 文件与 Red Hat 8 结合使用的更多信息,请参阅 Red Hat 文档中的 Starting Kickstart Installations 章节。

DGX-1、DGX Station 和 DGX Station A100 的磁盘分区

注意: 以下部分中的屏幕截图取自 DGX-1。DGX Station 和 DGX Station A100 安装的屏幕可能会显示略有不同的信息,例如磁盘大小、可用磁盘空间、接口名称等。
  1. Installation Destination屏幕上,选择要安装的第一个驱动器 (sda)。

    Storage Configuration下,单击Custom单选按钮,然后单击Done

    这将调出Manual Partitioning 窗口。

  2. 展开您选择的设备的下拉菜单,并删除所有现有分区,直到没有剩余分区。
  3. 单击左下角的+按钮以创建新分区。

    创建 /boot/efi 分区,大小为 512 MiB。

  4. 为设备类型选择Standard Partition

    Devices下,确保仅选择您在步骤 1 中选择的驱动器。单击“Update Settings”以确认您的更改。

  5. 再次单击左下角的+按钮以创建另一个新分区。

    创建 / 分区,这次将Desired Capacity字段留空。这会告知安装程序使用磁盘的剩余容量。

  6. 对于 / 分区,再次为设备类型选择Standard Partition

    Devices下,确保仅选择您在步骤 1 中选择的驱动器。对于文件系统,选择XFS。单击Update Settings以确认您的更改。

  7. 单击Done

    这会导致底部出现黄色警告栏,因为尚未创建交换分区。

  8. 再次单击Done,然后单击Accept Changes,将所有自定义设置写入磁盘。

  9. 返回到安装 Red Hat Enterprise Linux 部分中的步骤 5。

DGX-1、DGX Station 和 DGX Station A100 的加密磁盘分区

注意: 以下部分中的屏幕截图取自 DGX-1。DGX Station 和 DGX Station A100 安装的屏幕可能会显示略有不同的信息,例如磁盘大小、可用磁盘空间、接口名称等。
  1. Installation Destination屏幕上,选择要安装的第一个驱动器 (sda)。在Storage Configuration下,单击Custom单选按钮,然后单击Done

    这将调出Manual Partitioning 窗口。

  2. 展开您选择的设备的下拉菜单,并删除所有现有分区,直到没有剩余分区。

  3. 单击左下角的+按钮以创建新分区。

    创建 /boot/efi 分区,大小为 512 MiB。

  4. 为设备类型选择Standard Partition

    Devices下,确保仅选择您在步骤 1 中选择的驱动器。

    单击Update Settings以确认您的更改。

  5. 再次单击左下角的+按钮以创建另一个新分区。

    创建 /boot 分区,大小为 2 GiB。

  6. 对于 /boot 分区,再次为设备类型选择Standard Partition

    Devices下,确保仅选择您在步骤 1 中选择的驱动器。对于文件系统,选择XFS

    单击Update Settings以确认您的更改。

  7. 再次单击左下角的+按钮以创建另一个新分区。

    创建 / 分区,这次将Desired Capacity字段留空。这会告知安装程序使用磁盘的剩余容量。

  8. 对于 / 分区,再次为设备类型选择Standard Partition

    务必选中Encrypt复选框,并为LUKS Version选择luks2

    对于File System,选择XFS。再次确认此分区使用您在步骤 2 中选择的两个设备。

    单击Update Settings以确认您的更改。

    现在将出现提示,要求输入 LUKS 密码。

  9. 务必选择一个强度高且安全的密码。

    两次输入密码后,单击Save Passphrase

  10. 单击Done

    这会导致底部出现黄色警告栏,因为尚未创建交换分区。

  11. 再次单击Done,然后单击Accept Changes,将所有自定义设置写入磁盘。

  12. 返回到安装 Red Hat Enterprise Linux 部分中的步骤 5。

DGX-2 和 DGX A100 的磁盘分区

注意: 以下部分中的屏幕截图取自 DGX A100。DGX-2 安装的屏幕可能会显示略有不同的信息,例如磁盘大小、可用磁盘空间、接口名称等。
  1. Installation Destination屏幕上,选择两个 M.2 磁盘(即 DGX-2 的 894.25GB 驱动器,或 DGX A100 的 1.8 TB 驱动器)。

    Storage Configuration下,单击Custom单选按钮,然后单击Done

    这将调出Manual Partitioning 窗口。

  2. 展开您选择的设备的下拉菜单,并删除所有现有分区,直到没有剩余分区。
  3. 单击左下角的+按钮以创建新分区。

    创建 /boot/efi 分区,大小为 512 MiB。

  4. Device Type更改为RAID,将RAID Level更改为 RAID1,然后单击Update Settings并确认此分区覆盖您在步骤 2 中选择的两个设备。

  5. 再次单击左下角的+按钮以创建另一个新分区。

    创建 / 分区,这次将 Desired Capacity 字段留空。这会告知安装程序使用磁盘的剩余容量。

  6. 对于 / 分区,再次为Device TypeRAID1RAID Level 选择 RAID

    对于File System,选择XFS

    单击Update Settings以确认此分区使用您在步骤 2 中选择的两个设备。

  7. 单击Done

    这会导致底部出现黄色警告栏,因为尚未创建交换分区。

  8. 再次单击Done,然后单击Accept Changes,将所有自定义设置写入磁盘。

  9. 返回到安装 Red Hat Enterprise Linux 部分中的说明。

    这应该是配置以太网的步骤。

DGX-2 和 DGX A100 的加密磁盘分区

注意: 以下部分中的屏幕截图取自 DGX A100。DGX-2 安装的屏幕可能会显示略有不同的信息,例如磁盘大小、可用磁盘空间、接口名称等。
  1. Installation Destination屏幕上,选择两个 M.2 磁盘(即 DGX-2 的 894.25GB 驱动器,或 DGX A100 的 1.8 TB 驱动器)。

    Storage Configuration下,单击Custom单选按钮,然后单击Done

    这将调出Manual Partitioning 窗口。

  2. 展开您选择的设备的下拉菜单,并删除所有现有分区,直到没有剩余分区。

  3. 单击左下角的+按钮以创建新分区。

    创建 /boot/efi 分区,大小为 512 MiB。

  4. Device Type更改为RAID,将RAID Level更改为 RAID1,并通过单击Device(s)部分中的Modify并确保仍选中两个磁盘来确认此分区覆盖您在步骤 2 中选择的两个设备。

    请注意,左侧的分区信息可能尚未反映两个设备。

    单击Update Settings以确认您的更改,并验证显示的 /boot/efi 分区是否列出了分区名称而不是单个设备。

  5. 再次单击左下角的+按钮以创建另一个新分区。

    创建 /boot 分区,大小为 2 GiB

  6. 对于 /boot 分区,再次为Device TypeRAID1RAID Level 选择 RAID

    对于File System,选择XFS

    再次通过单击Device(s)部分中的 Modify 并确保仍选中两个磁盘来确认此分区使用您在步骤 2 中选择的两个设备。

    单击Update Settings以确认您的更改。

  7. 再次单击左下角的+按钮以创建另一个新分区。

    创建 / 分区,这次将Desired Capacity字段留空。这会告知安装程序使用磁盘的剩余容量。

  8. 对于 / 分区,再次为设备类型选择 RAID,RAID1 和 RAID Level。

    务必选中Encrypt复选框,并为LUKS Version选择luks2

    对于File System,选择XFS。再次确认此分区使用您在步骤 2 中选择的两个设备。

    单击Update Settings以确认您的更改,然后单击Done开始退出分区菜单。

    现在将出现提示,要求输入 LUKS 密码。

  9. 务必选择一个强度高且安全的密码。

    两次输入密码后,单击Save Passphrase

  10. 单击Done

    这会导致底部出现黄色警告栏,因为尚未创建交换分区。

  11. 再次单击Done,然后单击Accept Changes,将所有自定义设置写入磁盘。

  12. 返回到安装 Red Hat Enterprise Linux 部分中的步骤 5。