M.2 启动盘转接板组件更换#

本章适用于需要更换两个 M.2 操作系统驱动器的情况。在这种情况下,应订购更换转接板组件(包括两个 M.2 NVMe 驱动器)。

M.2 启动盘转接板组件更换概述#

这是更换启动盘转接板组件的步骤的概要概述。

  1. 确认两个 M.2 驱动器都无法访问且需要更换。

  2. 从 NVIDIA 企业支持部门获取更换的 M.2 转接板组件。

  3. 关闭系统电源。

  4. 标记所有主板托架电缆并拔下它们。

  5. 滑出主板托架并打开主板托架盖。

  6. 拉出带有两个 M.2 磁盘的 M.2 转接板组件。

  7. 安装新的带有两个 M.2 磁盘的 M.2 转接板组件。

  8. 关闭主板托架上的盖子。

  9. 将主板托架滑入系统。

  10. 使用标签作为参考,插入所有电缆。

  11. 开启系统电源。

  12. 重新安装操作系统并确认系统运行正常。

  13. 使用提供的包装将故障单元运回 NVIDIA 企业支持部门。

确定 M.2 NVMe 转接板组件故障#

以下是 NVIDIA 企业支持部门可能指示更换 M.2 转接板组件的情况

  • DGX A100 无法启动。

  • 从 SBIOS 中看不到启动盘。

  • 当从 ISO 镜像启动时,系统指示启动盘不可用。

  • 与 M.2 启动盘失去通信。

  • M.2 转接板组件损坏。

更换 M.2 NVMe 转接板组件#

在尝试更换 M.2 NVMe 转接板组件之前,请确保您已获得更换组件并保存了包装,以便在退回故障转接板组件时使用。

注意

静电敏感设备:- 务必遵守静电放电 (ESD) 防护的最佳实践。这包括确保人员和设备连接到公共接地,例如佩戴连接到机箱接地的腕带,并将组件放置在防静电工作表面上。

  1. 关闭系统电源。

    您可能需要使用 BMC 控制台。

  2. 标记连接到主板托架的所有电缆,以便于重新连接时识别。

  3. 卸下主板托架。

    请参阅 访问主板托架 部分中的说明。

  4. 通过提起转接板组件,从主板托架上卸下 M.2 转接卡。

    _images/m2-riser-remove.png
  5. 通过将转接卡插入其插槽,将组装好的模块安装在主板上。

    _images/m2-riser-replace.png
  6. 关闭主板托架盖,然后安装主板托架。

    请参阅 更换主板托架 部分中的说明。

  7. 将所有电缆连接到主板托架。

  8. 重新安装 DGX 操作系统服务器软件。

    有关详细说明,请参阅 DGX A100 用户指南

退回转接板组件#

使用新转接板组件的包装,并按照包装随附的说明将旧的转接板组件运回 NVIDIA 企业支持部门。

注意

如果您的组织购买了介质保留策略,您或许可以保留故障驱动器以进行销毁。请与 NVIDIA 企业支持部门核实该策略的状态以了解具体信息。