DOCA 文档 v2.10.0

此版本中的错误修复

参考编号

问题

4220089

描述:将 dpdkvhostuser 接口与 OVS-DOCA 结合使用会导致崩溃。

关键词:OVS

检测版本:2.9.0

4155959

描述:当 br-sfc 网桥中有上行链路时,上行链路到上行链路方向的 IPv6 流量会导致 OVS 崩溃,从而导致完全的流量丢失。

关键词:OVS

检测版本:2.4.0

4268399

描述:RX 队列可能会耗尽其 mbuf 池,从而导致不正确的 CQE 轮询错误地访问应用程序拥有的 mbuf,可能导致崩溃。

关键词:CQE;轮询;mbuf 覆盖

检测版本:2.9.0

4224295

描述:由于 DPU VTEP MAC 地址在 OVS 中老化,非 hostnetwork 工作负载之间的流量在 5 分钟后停止。

关键词:OVS;老化;VTEP MAC

检测版本:2.9.0

4200690

描述:fTPM 可信应用程序仅使用开发密钥进行测试目的签名(即,不安全)。

关键词:OP-TEE 上的 fTPM

检测版本:2.9.1

3962272

描述:rte_eth_dev_start() 执行不必要的 mlx5 控制流规则重新创建,导致 rte_eth_dev_start() 的延迟增加。

关键词:简单转发

检测版本:2.9.0

4130438

描述:在使用 NVIDIA® ConnectX ® -7 FHHL 适配器卡时,Firefly 不符合“SyncE to 1pps Class B/C 瞬态响应”。

关键词:Firefly

检测版本:2.9.0

参考编号

问题

4019161

描述:增加了 IPoIB 中的默认 TX 队列长度,以增强 qdisc 队列并减少 CPU 峰值。

关键词:TX 队列;qdisc;CPU

检测版本:2.10

4181675

描述:修复了在 SC 上创建多个活动 TX SA 时 SA 切换不正确的问题,这是由于未能遵守 encoding_sa 配置的 SA 造成的。

关键词:TX SA

检测版本:2.10

4037307

描述:修复了接收队列缓存大小计算,以考虑主机页面大小。

关键词:内存分配

检测版本:2.10

4125071

描述:--defltprio 标志已被弃用并从 mlnx_qos 工具中删除。

关键词:mlnx_qos 工具

检测版本:2.10

参考编号

问题描述

4206212

描述:当可纠正错误阈值 (CeThreshold) 设置为 5000 时,生成不可纠正错误 (UE) 会在首次发生可纠正错误 (CE) 内存故障后导致 CE CPER。

关键词:CPER

检测版本:4.9.1

4163840

描述:SMMU 已禁用,这可能会降低性能。

关键词:SMMU;性能

检测版本:4.5.1

3746866

描述:使用 ipmitool 版本 1.8.19-7 时,可能会出现错误消息 IANA PEN registry open failed: No such file or directory。此消息可以安全地忽略。

关键词:IPMI;Debian

检测版本:4.6.0

4052874

描述:不支持 UefiSignatureOwner 字段。如果此字段填充了数据,则会发生异常。

关键词:Redfish;UEFI

检测版本:4.7.0

4128189

描述:当通过 Redfish 使用 HTTP/HTTPS 更新 BlueField-2 系统上的 BFB 映像时,如果系统过载,操作可能会失败。

关键词:软件;更新;Redfish

检测版本:4.9.0

参考编号

问题

待定

描述:待定

发现版本:待定

内部参考

问题

4087432

描述:增加了 RX 无损缓冲区大小,以延迟 NIC 拥塞期间 Pause/PFC 帧的传输。

关键词:RX 无损缓冲区大小

发现版本32.43.2026

修复版本32.44.1036

4184904 / 4183908

描述:修复了 VDPA 功能位 GUEST_TSO4 和 GUEST_TSO6 意外默认设置的问题,导致流量中断。

关键词:VDPA,功能上限,GUEST_TSO4,GUEST_TSO6

发现版本32.43.2026

修复版本32.44.1036

4184910

描述:修复了启用 PCC NP 并将一个端口的链路类型设置为 IB,另一个端口设置为以太网可能导致 dmesg 中出现断言 ext_synd 0x8309 的问题。

关键词:PCC NP,端口类型

发现版本32.43.2026

修复版本32.44.1036

4206142

描述:修复了与警告断言 0x8a88 相关的问题,该问题是由于在使用 RNDV 类型创建 XRQ 期间对 mkey 的无害读取而发生的。

关键词:警告断言 0x8a88

发现版本32.43.2026

修复版本32.44.1036

4073037

描述:不正确的 GPIO 识别导致对过流事件的错误假设。修复 GPIO 定义解决了该问题。

关键词:GPIO 识别

发现版本32.43.2026

修复版本32.44.1036

4220460

描述:已从 strap 中删除 pkg_id 中默认启用的 MSB。pkg_id 现在支持 0 到 3 的值。

关键词:NC-SI 软件包 ID

发现版本32.43.2026

修复版本32.44.1036

3672595

描述:当在同一 PCORE 上使用多个链路时,如果一个链路断开(例如,由于电缆断开),则活动链路下方的 PCIe 树仅部分可见,仅枚举外部交换机 USP。

关键词:PCIe 树

发现版本32.43.2026

修复版本32.44.1036

3920614

描述:当连接到 XRQ 的 QP 通过 2ERR 命令移动到错误状态时,固件会等待设备中的请求完成,然后再发送新事件。软件必须等待此事件,然后才能继续使用新的 QP,从而防止新旧 QP 之间的请求冲突。

关键词:NVMe-oF 目标卸载

发现版本32.43.2026

修复版本32.44.1036

3956166

描述:修复了在 LAG 模式下使用 SOURCE_QP (mlxconfig 中的 ROCE_CC_SHAPER_COALESCE) 时 ZTR_RTTCC 算法中的问题,该问题导致多对一流量场景中的带宽较低。

关键词:LAG,PCC,ZTR_RTTCC

发现版本32.43.2026

修复版本32.44.1036

4258064

描述:当启用“为 DOCA PCC 的 RTT 数据包支持单独的优先级配置”并且在 DOCA PCC 启动后创建 QP 时,当 QP 被销毁时,dmesg 中会出现 fwassert 以及基本调试输出。除了 fwassert 之外,QP 的已分配转向规则未被释放,从而导致资源泄漏。

关键词:DOCA PCC

发现版本32.43.2026

修复版本32.44.1036

4265811

描述:修复了由于随机内存违规导致 HCA 初始化失败的问题。

关键词:HCA 初始化

发现版本32.43.2026

修复版本32.44.1036

3661179

描述:添加了一种新的分配和释放流程机制,以增强并行性。

关键词:分配、释放流程

发现版本32.39.2048

修复版本32.44.1036

4178900

描述:以下用于通信 DPU (BF3-COM-DPU) 的 nvconfig 设置现在默认设置

  • INTERNAL_CPU_MODEL=1

  • LAG_RESOURCE_ALLOCATION=1

  • NUM_OF_PF=0

  • CQE_COMPRESSION=1

  • NUM_OF_VFS=0

  • HAIRPIN_DATA_BUFFER_LOCK=1

  • MEMIC_SIZE_LIMIT=0

  • PCI_WR_ORDERING=1

关键词:通信 DPU (BF3-COM-DPU),默认 nvconfig 设置

发现版本32.42.1000

修复版本32.44.1036

3837255

描述:修复了从主机操作系统进程关闭 Arm 导致出现“-E- Failed to send Register MRSI”消息的问题。

关键词:主机操作系统;重启;错误

发现版本32.42.1000

修复版本32.44.1036

内部参考

问题

4206142

描述:修复了与警告断言 0x8a88 相关的问题,该问题是由于在使用 RNDV 类型创建 XRQ 期间对 mkey 的无害读取而发生的。

关键词:警告断言 0x8a88

发现版本24.43.2026

修复版本24.44.1036

4154495

描述:修复了罕见问题,即当仿真门铃发生故障时,导致流量停止并阻止恢复。

关键词:门铃

发现版本24.43.2026

修复版本24.44.1036

© 版权所有 2025, NVIDIA。 上次更新时间:2025 年 2 月 12 日。