更新 NVMe 固件#

以下说明描述了如何使用 NVME-CLI 命令行界面更新 NVMe 设备上的固件。nvme-cli 工具已预装在所有 DGX H100/H200 系统上。

  1. 列出设备并检查固件版本。

    $ sudo nvme list
    
    Node           SN               Model                        Namespace Usage                     Format           FW Rev
    -------------- ---------------- ---------------------------- --------- ------------------------- ---------------- --------
    /dev/nvme0n1   S666NE0T395778   SAMSUNG MZ1L21T9HCLS-00A07   1           1.18  TB /   1.92  TB   512   B +  0 B   GDC7302Q
    /dev/nvme1n1   S666NE0T395802   SAMSUNG MZ1L21T9HCLS-00A07   1           1.18  TB /   1.92  TB   512   B +  0 B   GDC7302Q
    /dev/nvme2n1   22L0A031T2N8     KCM6DRUL3T84                 1          27.04  GB /   3.84  TB   512   B +  0 B   0107
    /dev/nvme3n1   22W0A02AT2N8     KCM6DRUL3T84                 1          27.57  GB /   3.84  TB   512   B +  0 B   0107
    /dev/nvme4n1   22W0A02HT2N8     KCM6DRUL3T84                 1          26.19  GB /   3.84  TB   512   B +  0 B   0107
    /dev/nvme5n1   22L0A01WT2N8     KCM6DRUL3T84                 1          25.44  GB /   3.84  TB   512   B +  0 B   0107
    /dev/nvme6n1   22L0A025T2N8     KCM6DRUL3T84                 1          24.91  GB /   3.84  TB   512   B +  0 B   0107
    /dev/nvme7n1   22L0A02CT2N8     KCM6DRUL3T84                 1          25.17  GB /   3.84  TB   512   B +  0 B   0107
    /dev/nvme8n1   22L0A01FT2N8     KCM6DRUL3T84                 1          24.65  GB /   3.84  TB   512   B +  0 B   0107
    /dev/nvme9n1   22L0A01YT2N8     KCM6DRUL3T84                 1          24.37  GB /   3.84  TB   512   B +  0 B   0107
    

    从输出中,您可以找到设备名称和固件版本,例如 /dev/nvme0n1GDC7302Q

  2. 下载您要为 NVMe 设备升级的固件。

    根据步骤 1 中的命令输出,使用下表确定固件文件,并包括下载固件的正确路径

    $ sudo nvme fw-download $DeviceName --fw=***(specify the firmware file for upgrade)
    

    此表列出了受支持的 Samsung 和 Kioxia 型号的固件文件名

    制造商

    型号

    固件文件

    Samsung

    MZ1L21T9HCLS-00A07

    General_PM9A3_M.2_GDC7502Q_Noformat.bin

    Samsung

    MZWLO3T8HCLS-00A07

    General_PM1743_U.2_OPPA4B5Q.bin

    Kioxia

    KCM6DRUL3T84

    CM6-SED-0107.std

    Kioxia

    KCM7DRUL3T84

    CM6-SED-0107.std

  3. 立即提交并激活下载的固件,无需重置,方法是将 action 参数设置为 3

    $ sudo nvme fw-commit $DeviceName --action=3
    
  4. 验证正确的固件版本是否已更新。

    $ sudo nvme id-ctrl $DeviceName