网络接口卡更换#

网卡更换概述#

这是更换 NVIDIA DGX™ B200 系统上一个或多个网卡的 процедура 的高级概述。

  1. 识别故障卡。

  2. 从 NVIDIA 企业支持部门获取更换的以太网卡。

  3. 确保系统已关机。

  4. 如果电缆不够长,请标记所有电缆并从主板托架上拔下它们。

  5. 将主板滑出,直到锁定到位。

  6. 打开后部隔间。

  7. 拔出故障的以太网卡。

  8. 安装新的以太网卡。

  9. 关闭后部主板隔间。

  10. 将主板滑回系统。

  11. 使用标签作为参考,插入所有电缆。

  12. 开启系统电源。

  13. 测试以太网卡。

  14. 使用提供的包装将故障单元发送给 NVIDIA 企业支持部门。

准备系统进行更换#

通常,网络接口卡无法工作的原因如下:

  • 操作系统未检测到设备。

  • 设备不传输或接收数据。

在排除外部连接问题后,请联系 NVIDIA 企业支持部门以接收更换卡。

收到卡后,通过执行以下操作开始更换:

  1. 关闭系统电源。

  2. 打开主板托架 I/O 挡板,以访问主板的后部。有关更多信息,请参阅 主板托架 - 打开和关闭 I/O 挡板

卸下故障卡#

首先,将锁定机构旋转 90 度,以便可以将卡从 PCI 插槽中取出

  1. 确认主板托架维修盖已打开,并松开插槽 1 和 3 旁边 PCI 卡锁定机构的翼形螺钉

    _images/dgx-b200-mb-tray-lock-2.png
  2. 如图所示,旋转锁定机构 90 度以释放 PCI 卡

    _images/card-riser.png
  3. 将 PCI 以太网卡从插槽中拉出

    _images/dgx-b200-pci-eth-remove.png
  4. 从系统中取出卡

    _images/card-remove.png

安装新卡并关闭锁#

  1. 将新卡插入上方的 PCI 插槽

    _images/dgx-b200-pci-eth-insert.png
  2. 旋转锁定机构以固定 PCI 卡

    _images/dgx-b200-card-close-lock.png
  3. 拧紧黑色翼形螺钉以固定锁定机构

    _images/dgx-b200-mb-tray-io-slot-left-tighten.png

完成网络接口卡更换#

  1. 关闭主板托架 I/O 挡板并插入主板托架。有关更多信息,请参阅 主板托架 - 打开和关闭 I/O 挡板

  2. 开启电源并启动系统。

  3. 检查更换卡上的网络连接。

  4. 通过运行 nvsm 命令确认系统运行正常

    sudo nvsm show health
    
  5. 使用提供的包装将故障单元发送给 NVIDIA 企业支持部门。