网络接口卡更换#

网卡更换概述#

这是 NVIDIA DGX™ H100/H200 系统上更换一个或多个网卡的流程的高级概述。

  1. 识别故障卡

  2. 从 NVIDIA 企业支持部门获取更换的以太网卡

  3. 确保系统已关机

  4. 如果线缆不够长,标记所有线缆并从主板托架上拔下

  5. 将主板滑出,直至锁定到位

  6. 打开后部隔间

  7. 拔出坏的以太网卡

  8. 安装新的以太网卡

  9. 关闭后部主板隔间

  10. 将主板滑回系统

  11. 使用标签作为参考,插入所有线缆

  12. 开启系统电源

  13. 测试以太网卡

  14. 使用提供的包装将故障单元运回 NVIDIA 企业支持部门

准备系统以进行更换#

通常,网络接口卡出现问题的原因如下

  1. 操作系统未检测到设备。

  2. 设备不传输或接收数据。

在排除外部连接问题后,请联系 NVIDIA 企业支持部门以获取更换卡。

收到卡后,执行以下操作开始更换

拆卸故障卡#

首先,将锁定机构旋转 90 度,以便可以将卡从 PCI 插槽中取出

  1. 确认主板托架维修盖已打开,并拧松插槽 1 和 3 旁边的 PCI 卡锁定机构的翼形螺钉

    _images/mb-tray-lock-2.png
  2. 旋转锁定机构以释放 PCI 卡,如下图所示

    _images/card-riser.png
  3. 从转接卡中的插槽中拔出 PCI 以太网卡

    _images/dgx-h100-pci-eth-remove.png
  4. 从系统中取出卡

    _images/card-remove.png

安装新卡并关闭锁#

  1. 将 PCI 卡放置在系统中

    _images/dgx-h100-pci-eth-install-place.png
  2. 将卡推入 PCI 插槽

    _images/dgx-h100-pci-eth-install-push.png
  3. 关闭闩锁以将 PCI 卡锁定到位

    _images/card-close-lock.png
  4. 拧紧黑色翼形螺钉以固定锁定机构

    _images/dgx-h100-mb-tray-io-slot-left-tighten.png

完成网络接口卡更换#

有关执行以下操作的信息,请参阅 主板托架 - 打开和关闭 IO 门

  1. 关闭主板托架 IO 门。

  2. 锁定主板盖。

  3. 插入主板。

  4. 将线缆重新连接到其端口。