NVIDIA DGX H100/H200 系统的固件变更#

DGX H100/H200 系统的 BMC 变更#

24.09.17 版本的变更#

  • 修复了升级后 BMC 配置可能重置的问题。

  • 添加了 Redfish API 支持,用于创建、修改和删除电源策略。

  • 支持使用 Web UI 部署固件更新。

  • Redfish 禁用主机接口:保持 redfish 从 BIOS 到 BMC 的功能,但阻止从操作系统到 BMC 的直接路径。

  • 在已配置的证书链中添加了指定中间证书颁发机构的功能。

  • 包含其他 Redfish 指标报告。

  • 修复了 SNMP、syslog 和 rsyslog 问题。

  • 为每个 BMC 添加了 AES 密钥,用于在配置保存和恢复过程中加密用户/密码文件。

  • 修复了 LDAP/AD 设置中的无效域问题。

  • 增强了 Redfish 诊断功能。

  • Redfish API 和 IPMI 的通用性能改进。

  • 添加了对 ConnectX-7 温度传感器的支持。

  • 提高了能量计数器的分辨率。

  • 增强了远程媒体,支持端口号和域名。

  • Web UI 的通用改进。

24.01.05 版本的变更#

  • 修复了 NVMe 驱动器的 SEL 日志可能被填满的问题

  • 修复了 BMC 重启后 HMC 可能在 BMC 中不可见的低概率事件

  • 能够控制主机的 IPMI 可见性(允许全部、有限命令、隐藏)

  • 通过 Redfish 提高 CPU 和 GPU 能量遥测的分辨率

  • 提高了 Redfish 库存的可靠性

  • 提高了遥测收集的整体稳定性,并处理无效/缺失值

  • WebUI 的通用改进

23.09.20 版本的变更#

  • WebUI 增强功能

  • 在 WebUI 中启用 GPU 信息

  • 通过 Redfish 启用 NVRAM 清除

  • 恢复出厂设置后禁用 RMCP/MD5 身份验证支持

  • 启用 EROT 后台复制

  • 启用默认 SNMPv3 MIB

  • BMC 更新包含软件安全增强功能。有关详细信息,请参阅NVIDIA DGX H100 - 2023 年 8 月安全公告

DGX H100/H200 系统的 SBIOS 变更#

v1.05.03 版本的变更#

  • 在运行时遇到无法纠正错误的 DIMM 将在下次启动时被映射出去。

  • 公开了 C1AutoDemotionC1AutoUnDemotionC6Enable 设置选项。

  • 将 CPU 设置选项页面移至设置 UI 中的“高级”页面下。

  • 添加了一个设置选项,以限制通过 IPMI 的主机访问。

  • 提供了 NvramVarsProtectionInOs 设置选项,以防止操作系统在运行时更改 NVRAM。

  • 实现了不可纠正的错误率限制,在错误泛滥时以及在报告 MLC(中级缓存)黄色状态的核心上禁用了 CSMI(可纠正的系统管理中断),并在跨越 ANF(咨询性非致命错误)阈值时记录 SEL。

  • SncEn 默认设置更改为 disable

v1.01.03 版本的变更#

  • 添加了对保护 KCS 的支持

v1.01.01 版本的变更#

  • 修复了 NIC 端口的启动选项标签

  • 修复了 U.2 托架插槽编号

  • 将 RestoreROWritePerf 选项设置为仅专家模式

  • 仅在专家用户模式下公开 TDX 和 IFS 选项

nvfwupd 命令变更#

v2.0.4 版本的变更#

  • 增强了 DGX 平台的自动服务器类型检测。

  • 不支持 activate_fw 命令。

v2.0.1 版本的变更#

  • 改进了日志清理,默认情况下屏蔽 IP 地址和登录凭据。

  • 添加了通过配置文件从命令行界面 (CLI) 覆盖 --target--package 的支持。

  • 使用 servertype 子选项增强了 --target 选项,以解决未识别的平台错误。

v2.0.0 版本的变更#

  • 支持使用平台无关的配置文件。

v1.1.3 版本的变更#

  • 支持缩写的固件更新包名称。

  • 增强了 show_update_progress 输出,为 Redfish 提供完整的状态报告。

  • 支持自定义日志文件路径。

  • 对于任何更新失败或工具失败,该命令都会以错误代码 1 退出。

v1.1.1 版本的变更#

  • 您可以一次更新主板托架上的所有系统组件。以前,您必须单独更新组件。

  • 您可以创建一个包含多个系统的网络地址和凭据的 JSON 文件,并自动串行更新多个系统。有关更多信息,请参阅更新多个系统