NVIDIA DGX H100/H200 系统的固件变更#
DGX H100/H200 系统的 BMC 变更#
24.09.17 版本的变更#
修复了升级后 BMC 配置可能重置的问题。
添加了 Redfish API 支持,用于创建、修改和删除电源策略。
支持使用 Web UI 部署固件更新。
Redfish 禁用主机接口:保持 redfish 从 BIOS 到 BMC 的功能,但阻止从操作系统到 BMC 的直接路径。
在已配置的证书链中添加了指定中间证书颁发机构的功能。
包含其他 Redfish 指标报告。
修复了 SNMP、syslog 和 rsyslog 问题。
为每个 BMC 添加了 AES 密钥,用于在配置保存和恢复过程中加密用户/密码文件。
修复了 LDAP/AD 设置中的无效域问题。
增强了 Redfish 诊断功能。
Redfish API 和 IPMI 的通用性能改进。
添加了对 ConnectX-7 温度传感器的支持。
提高了能量计数器的分辨率。
增强了远程媒体,支持端口号和域名。
Web UI 的通用改进。
24.01.05 版本的变更#
修复了 NVMe 驱动器的 SEL 日志可能被填满的问题
修复了 BMC 重启后 HMC 可能在 BMC 中不可见的低概率事件
能够控制主机的 IPMI 可见性(允许全部、有限命令、隐藏)
通过 Redfish 提高 CPU 和 GPU 能量遥测的分辨率
提高了 Redfish 库存的可靠性
提高了遥测收集的整体稳定性,并处理无效/缺失值
WebUI 的通用改进
23.09.20 版本的变更#
WebUI 增强功能
在 WebUI 中启用 GPU 信息
通过 Redfish 启用 NVRAM 清除
恢复出厂设置后禁用 RMCP/MD5 身份验证支持
启用 EROT 后台复制
启用默认 SNMPv3 MIB
BMC 更新包含软件安全增强功能。有关详细信息,请参阅NVIDIA DGX H100 - 2023 年 8 月安全公告。
DGX H100/H200 系统的 SBIOS 变更#
v1.05.03 版本的变更#
在运行时遇到无法纠正错误的 DIMM 将在下次启动时被映射出去。
公开了
C1AutoDemotion
、C1AutoUnDemotion
和C6Enable
设置选项。将 CPU 设置选项页面移至设置 UI 中的“高级”页面下。
添加了一个设置选项,以限制通过 IPMI 的主机访问。
提供了
NvramVarsProtectionInOs
设置选项,以防止操作系统在运行时更改 NVRAM。实现了不可纠正的错误率限制,在错误泛滥时以及在报告 MLC(中级缓存)黄色状态的核心上禁用了 CSMI(可纠正的系统管理中断),并在跨越 ANF(咨询性非致命错误)阈值时记录 SEL。
将
SncEn
默认设置更改为disable
。
v1.01.03 版本的变更#
添加了对保护 KCS 的支持
v1.01.01 版本的变更#
修复了 NIC 端口的启动选项标签
修复了 U.2 托架插槽编号
将 RestoreROWritePerf 选项设置为仅专家模式
仅在专家用户模式下公开 TDX 和 IFS 选项
nvfwupd 命令变更#
v2.0.4 版本的变更#
增强了 DGX 平台的自动服务器类型检测。
不支持
activate_fw
命令。
v2.0.1 版本的变更#
改进了日志清理,默认情况下屏蔽 IP 地址和登录凭据。
添加了通过配置文件从命令行界面 (CLI) 覆盖
--target
和--package
的支持。使用
servertype
子选项增强了--target
选项,以解决未识别的平台错误。
v2.0.0 版本的变更#
支持使用平台无关的配置文件。
v1.1.3 版本的变更#
支持缩写的固件更新包名称。
增强了
show_update_progress
输出,为 Redfish 提供完整的状态报告。支持自定义日志文件路径。
对于任何更新失败或工具失败,该命令都会以错误代码
1
退出。
v1.1.1 版本的变更#
您可以一次更新主板托架上的所有系统组件。以前,您必须单独更新组件。
您可以创建一个包含多个系统的网络地址和凭据的 JSON 文件,并自动串行更新多个系统。有关更多信息,请参阅更新多个系统。