ECMP

等价多路径 (ECMP) 是一种路由策略,其中数据包沿多条等价路径转发。对于具有多个已安装下一跳的 IPv4 和 IPv6 路由,会自动进行负载分担。硬件或路由协议配置决定了负载分担发生的最大路由数。

请参阅 Cumulus Linux 和 ECMP 以获取有关 ECMP 的更多信息。

NVIDIA Spectrum 交换机在运行 Cumulus Linux 上支持 ECMP 监控。

ECMP 命令

使用以下命令监控 ECMP 路由数据。请参阅命令行参考,了解其他选项、定义和示例。

netq show ecmp
netq show ecmp-hash-config

在 UI 中查看 ECMP 资源利用率

您可以在全屏交换机卡片中查看 ECMP 下一跳的资源利用率。在全局搜索字段中搜索设备的主机名,或从标头中选择 添加卡片 > 设备卡片。从列表中选择一个交换机。当卡片在仪表板上打开时,将其扩展到最大尺寸。

从侧面菜单中选择 转发资源。ECMP 下一跳列显示了在转发表中看到的最大跳数、已使用的数量以及此使用率与最大数量相比的百分比。

自适应路由

自适应路由是一种负载均衡功能,它通过根据交换机的状态(例如队列占用率和端口利用率)动态选择转发路径,来提高符合条件的 IP 数据包的网络利用率。您可以使用自适应路由仪表板以直方图的形式查看具有自适应路由功能的交换机、与自适应路由相关的事件、RoCE 设置和出队队列长度。

要求

  • Spectrum-4 交换机支持自适应路由监控。它需要运行 Cumulus Linux 5.5.0 或更高版本的交换矩阵。
  • 要显示自适应路由数据,您必须在交换机上配置自适应路由;可以启用或禁用它。没有自适应路由配置的交换机将不会出现在 UI 或 CLI 中。
  • 必须启用 RoCE 无损模式 才能显示自适应路由数据。启用了 RoCE 有损 模式的交换机将出现在 UI 和 CLI 中,但不会显示自适应路由数据。
  • 要查看交换机的 直方图数据 和自适应路由不平衡事件,您必须在交换机上启用 ASIC 监控。如果您停止 asic-monitor 服务,NetQ 将报告所有直方图指标(P95、标准差、平均值和最大队列长度)的值为 0。

自适应路由命令

使用 netq show adaptive-routing config 命令监控自适应路由。这些命令的输出显示交换机上全局或接口级别的自适应路由信息。

netq show adaptive-routing config global
netq show adaptive-routing config interface

访问自适应路由仪表板

从标头或 菜单中,选择 Spectrum-X,然后选择 自适应路由

自适应路由仪表板显示

  • 配置了自适应路由(启用或禁用)的设备及其 RoCE 模式(有损或无损)。
  • 交换机上的接口列表及其配置。
adaptive routing dashboard displaying two devices with AR enabled

在“接口”列中,选择 查看详细信息 以查看配置了自适应路由的接口

list of interfaces adaptive routing configured

“事件”选项卡显示自适应路由事件的摘要,包括 ECMP 流量不平衡。该表最多显示 10 个交换机,可以按最高 P95 值、最高标准差或与 P95 值偏差最大的端口(在过去 3 分钟内聚合)进行排序。在此面板中,您可以选择“查看直方图”列中的 查看更多 以显示任何列出的交换机的 直方图形式的队列长度

dashboard displaying ECMP imbalances