U.2 NVMe 缓存驱动器安装后任务

本章介绍更换 U.2 NVME 驱动器或从 8 个升级到 16 个驱动器后通常需要的任务。

重建缓存 RAID 0 卷

  1. 停止 cachefilesd。
    $ sudo systemctl stop cachefilesd 
  2. 卸载 /raid 并停止 raid-0。
    $ sudo umount –f /raid
    $ sudo mdadm –-stop /dev/md1
  3. 运行脚本以重建 RAID 卷。
    $ sudo /usr/bin/configure_raid_array.py –c –f
    在任何问题处按 Y
  4. 完成后,确认 /raid 卷已挂载。
    $ df -hl /raid
    /dev/md1 文件系统应挂载在 /raid 上,大小为 28 TB 或 56 TB,具体取决于安装的是 8 个还是 16 个驱动器。

确认卷已准备就绪

  1. 使用以下命令确认系统中存储设备和卷的健康状况。
    $ sudo nvsm show systems/localhost/storage/volumes/md1 
  2. 验证 Status_Health=OK,并且 Drives = 中列出的驱动器数量符合预期。
  3. 确认驱动器现在可用。
    $ sudo mdadm -D /dev/md1  
如果驱动器制造商是 Micron,请执行“启用温度传感器”中的步骤。

启用温度传感器

本节中的步骤仅适用于 Micron NVMe 驱动器。
  1. 通过运行 ipmitool 验证是否需要为已安装的 NVMe 驱动器启用温度读取。
    $ sudo ipmitool sdr | grep -i temp | grep -i -e nvme*temp -e temp_u2
  2. 如果任何 NVMe 驱动器未显示温度读数,则在所有驱动器上启用 SMBUS。
    1. 在运行脚本之前建立 root 角色。
      $ sudo su
    2. 运行以下脚本。
      :user# for drives in `nvme list|grep Micron | cut -d' ' -f1 |sed 's/..$//'`;
      do /opt/MicronTechnology/MicronMSECLI/msecli -M -k 1 -n $drives ;
      done
    3. 退出 root 角色。
      :user# exit
  3. 通过运行 ipmitool 确认已更换驱动器的温度读取已启用。
    $ sudo ipmitool sdr | grep -i temp | grep -i -e nvme*temp -e temp_u2

退回 NVMe 驱动器/转接板组件

使用新驱动器/转接板组件的包装,并按照包装随附的说明将旧驱动器/转接板组件运回 NVIDIA 企业支持部门。
注意: 如果您的组织购买了介质保留策略,您或许可以保留故障驱动器以进行销毁。有关具体信息,请咨询 NVIDIA 企业支持部门以了解该策略的状态。