RoCE

使用 UI 或 CLI 监控 Spectrum 交换机和 BlueField DPU 的 RDMA over Converged Ethernet (RoCE)。

RoCE 命令

以下命令显示您网络的 RoCE 配置、RoCE 计数器和计数器池以及 RoCE 相关事件。有关其他选项、定义和示例,请参阅命令行参考

netq show roce-config 
netq show roce-counters (dpu | nic)
netq show roce-counters pool
netq show events message_type tca_roce
netq show events message_type roceconfig

netq check roce 命令检查网络结构中所有节点上 RoCE 和 QoS 配置的一致性。

netq check roce

在 UI 中全网络查看 RoCE 计数器

  1. 从标头或 菜单中,选择 Spectrum-X,然后选择 RoCE

  2. 选择 RoCE 交换机RoCE DPU

RoCE 交换机选项卡显示网络中所有运行 RoCE 的交换机的传输 (TX) 和接收 (RX) 计数器以及计数器池。

RoCE DPU 选项卡显示网络中所有运行 RoCE 的 DPU 的物理端口、优先级端口、RoCE 扩展、RoCE 和外围组件互连 (PCI) 信息。

查看给定交换机的 RoCE 计数器

您可以查看给定交换机的以下 RoCE 计数器

  • 接收和传输计数器
  • 通用、CNP 和 RoCE 特定计数器
  • 计数器池
  • 端口特定计数器

要在交换机上查看 RoCE 计数器,请在全局搜索字段中搜索设备的hostname,或从标头中选择 添加卡片 > 设备卡片。选择正在运行 RoCE 的交换机,并在工作台上打开大卡片。单击 RoCE 选项卡以查看 RoCE 计数器及其关联端口

switch card displaying list of ports

将卡片展开到最大尺寸,然后从侧面菜单中选择 RoCE 计数器。使用表格上方的控件按 Rx、Tx 或池查看、筛选或导出计数器统计信息。

禁用 RoCE 监控

要禁用 RoCE 监控

  1. 编辑 /etc/netq/commands/cl4-netq-commands.yml 并注释掉以下行

     cumulus@netq-ts:~$ sudo nano /etc/netq/commands/cl4-netq-commands.yml
    
     #- period: "60"
     #  key: "roce"
     #  isactive: true
     #  command: "/usr/lib/cumulus/mlxcmd --json roce counters"
     #  parser: "local"
    
  2. 删除 /var/run/netq/netq_commands.yml 文件

     cumulus@netq-ts:~$ sudo rm /var/run/netq/netq_commands.yml
    
  3. 重启 NetQ 代理

    cumulus@netq-ts:~$ netq config agent restart