可信平台模块更换#

注意

静电敏感设备:务必遵守静电放电 (ESD) 保护的最佳实践。这包括确保人员和设备连接到公共接地,例如佩戴连接到机箱接地的腕带,并将组件放置在防静电工作表面上。

可信平台模块更换概述#

这是 NVIDIA DGX™ H100/H200 系统上更换可信平台模块 (TPM) 的步骤的高级概述。

  1. 如果已启用,请禁用驱动器加密。

  2. 关闭系统。

  3. 标记所有主板托架电缆并拔下它们。

  4. 滑出主板托架。

  5. 卸下托架盖和 DIMM 导风罩。

  6. 抬起 OSFP 载波模块以接触 TPM。

  7. 更换主板上的 TPM。

  8. 安装 OSFP 载波模块。

  9. 安装 DIMM 导风罩和主板托架盖。

  10. 将主板托架滑入系统。

  11. 使用标签作为参考,插入所有电缆。

  12. 开启系统电源。

  13. 如果数据驱动器需要保护,则启用加密。

准备系统以进行更换#

  1. 如果数据驱动器已加密,则安装了 tpm2 OS 软件包,并且在 SBIOS 中启用了 TPM,请禁用加密

    sudo nv-disk-encrypt disable
    
  2. 关闭系统电源。

  3. 卸下主板托架。有关更多信息,请参阅 主板托架 - 拆卸和安装

  4. 卸下 DIMM 导风罩。

更换 TPM 模块#

  1. 找到主板上的 OSFP 载波模块。请参阅下图

    _images/dgx-h100-osfp-carrier-pin.png
  2. 如图所示,将 OSFP 载波模块朝 DIMM 移动。在倾斜载波模块之前,请确保系统后部的 OSFP 端口笼未干扰托架钣金

    _images/dgx-h100-osfp-carrier-remove-move.png
  3. 如图所示,旋转 OSFP 载波模块以接触 TPM

    _images/dgx-h100-osfp-carrier-remove-tilt.png
  4. 更换 TPM。确保 TPM 的位置与原始 TPM 的方向相同。

    _images/dgx-h100-osfp-carrier-replace-tpm.png

安装 OSFP 载波模块#

  1. 旋转 OSFP 载波模块,使其返回到原始位置。旋转模块时,将模块朝 DIMM 拉动,以使端口不干扰主板托架框架

    _images/dgx-h100-osfp-carrier-install-tilt.png
  2. 将 OSFP 载波模块朝托架外部移动,以使 OSFP 端口笼穿过主板托架框架中的开口

    _images/dgx-h100-osfp-carrier-install-move.png

完成 TPM 更换#

  1. 安装导风罩,关闭主板,然后将托架安装到机箱中。有关更多信息,请参阅 主板托架 - 拆卸和安装

  2. 插入所有电缆。

  3. 安装所有电源线。

  4. 开启系统电源。

  5. 如果数据驱动器已加密,则安装了 tpm2 OS 软件包,并且在更换之前在 SBIOS 中启用了 TPM,请启用加密

    sudo nv-disk-encrypt init -g -r -k <your vault password>
    
  6. 使用 nvsm 命令确认系统运行状况良好

    sudo nvsm show health