可信平台模块更换#

注意

静电敏感设备:务必遵守静电放电 (ESD) 防护的最佳实践。确保人员和设备连接到公共接地,例如佩戴连接到机箱接地的腕带并将组件放置在防静电工作表面上。

可信平台模块更换概述#

这是在 NVIDIA DGX™ B200 系统上更换可信平台模块 (TPM) 的流程的高级概述。

  1. 如果已启用,请禁用驱动器加密。

  2. 关闭系统。

  3. 标记所有主板托架电缆并拔下它们。

  4. 滑出主板托架。

  5. 卸下托架盖和 DIMM 空气挡板。

  6. 提起 OSFP 载波模块以访问 TPM。

  7. 更换主板上的 TPM。

  8. 安装 OSFP 载波模块。

  9. 安装 DIMM 空气挡板和主板托架盖。

  10. 将主板托架滑入系统。

  11. 使用标签作为参考插入所有电缆。

  12. 开启系统电源。

  13. 通过运行 nvsm show health 确认系统运行状况良好。

  14. 如果需要保护数据驱动器,请启用加密。

准备系统以进行更换#

  1. 从 NVIDIA 获取新的 TPM。

  2. 如果数据驱动器已加密,则安装了 tpm2 OS 软件包,并且在 SBIOS 中启用了 TPM,请禁用加密

    sudo nv-disk-encrypt disable
    
  3. 关闭系统。

  4. 标记所有网络、显示器和 USB 电缆

  5. 卸下主板托架。有关更多信息,请参阅 主板托架 - 拆卸和安装

  6. 卸下 DIMM 空气挡板。

    _images/dgx-b200-case-rear.png

更换 TPM 模块#

  1. 在主板上找到 OSFP 载波模块,如下图中绿色箭头所示

    _images/dgx-h100-osfp-carrier-pin.png
  2. 如图所示,将 OSFP 载波模块朝 DIMM 移动。

    在倾斜载波模块之前,确保系统后部的 OSFP 笼架不会干扰托架钣金

    _images/dgx-h100-osfp-carrier-remove-move.png
  3. 旋转 OSFP 载波模块以访问 TPM,如下图所示

    _images/dgx-h100-osfp-carrier-remove-tilt.png
  4. 更换 TPM。确保 TPM 的方向与原始方向相同。

    _images/dgx-h100-osfp-carrier-replace-tpm.png

安装 OSFP 载波模块#

  1. 旋转 OSFP 载波模块以使其返回到原始位置。在旋转模块时,将模块拉向 DIMM,使端口不会干扰主板托架框架

    _images/dgx-h100-osfp-carrier-install-tilt.png
  2. 将 OSFP 载波模块朝托架外侧移动,使 OSFP 笼架穿过钣金上的开口

    _images/dgx-h100-osfp-carrier-install-move.png

完成 TPM 更换#

  1. 安装空气挡板,关闭主板,并将托架安装到机箱中。有关更多信息,请参阅 主板托架 - 拆卸和安装

  2. 插入所有电缆。

  3. 安装所有电源线。

  4. 开启系统电源。

  5. 如果在更换之前数据驱动器已加密,则安装了 tpm2 OS 软件包,并且在 SBIOS 中启用了 TPM,请启用加密

    sudo nv-disk-encrypt init -g -r -k <your vault password>
    
  6. 使用 nvsm 命令确认系统运行状况良好

    sudo nvsm show health