U.2 NVMe 缓存盘从 4 升级到 8#

如果您需要更大的驱动器缓存容量,可以通过向 DGX A100 系统添加另外四个 NVMe 驱动器来增加缓存。

重要提示

升级时,请仅使用与现有四个驱动器密度(容量)相同的 U.2 NVMe 驱动器。

U.2 NVMe 缓存盘升级概述#

这是升级 DGX A100 系统的缓存大小所需步骤的概要。

  1. 确定当前安装的 NVMe 驱动器的密度(容量)。

  2. 向 NVIDIA 销售团队订购额外的四个 NVMe 驱动器。

  3. 关闭系统电源。

  4. 拆下空白驱动器插槽中的导风罩。

  5. 将 NVMe 驱动器安装到 DGX A100 系统中。

  6. 开启系统电源。

  7. 重新初始化 /raid 文件系统以识别所有八个驱动器。

  8. 通过运行 nvsm show health 确认系统运行状况良好。

确定要订购的 NVMe 驱动器#

  1. 通过发出以下命令来确定 RAID 卷中的驱动器。

    $ sudo nvme list
    
  2. 确定当前安装的驱动器的驱动器大小(3.84 TB 或 7.68 TB),并从 NVIDIA 销售团队订购相同密度(容量)的驱动器。

    注意

    如果安装的是 3.84 TB 驱动器,但您想使用或添加 7.68 TB 驱动器,请参阅 U.2 NVMe 缓存盘升级到 7.68 TB 硬盘 以获取说明。

安装可选的 NVMe 驱动器#

  1. 确保您已获得额外的驱动器。

  2. 将任何关键数据备份到网络共享卷或其他备份方式。

  3. 使用电源按钮或通过控制台关闭系统电源。

  4. 从插槽 1、3、5 和 7 中卸下空白填充模块。

    _images/nvme-cache-id.png
    1. 按下释放杆按钮(位于释放杆的右侧)以解锁释放杆。

      _images/u2-blank-unlock.png
    2. 拉动释放杆以卸下空白填充模块。

      _images/us-blank-remove.png
  5. 移动插槽 4 和 6 中的驱动器并安装到插槽 1 和 3 中。

    _images/u2-nvme-moving.png
    1. 按下释放杆按钮(位于释放杆的右侧)以解锁释放杆。

      _images/u2-blank-unlock.png
    2. 拉动释放杆以卸下模块。

      _images/u2-nvme-replace.png
    3. 解锁释放杆,然后将驱动器滑入插槽,直到前面板与其他驱动器齐平

    4. 关闭释放杆并将其锁定到位。

      _images/u2-nvme-lock.png
  6. 将新的 NVMe 驱动器安装到插槽 4、5、6 和 7 中。

    1. 解锁释放杆,然后将驱动器滑入插槽,直到前面板与其他驱动器齐平

    2. 关闭释放杆并将其锁定到位。

      _images/u2-nvme-lock.png
  7. 开启系统电源。

执行 U.2 NVMe 缓存盘安装后任务 章节中描述的任务。