监控事件

使用 UI 或 CLI 监控事件:您可以查看整个网络中的所有事件或设备上的所有事件,然后根据事件类型、严重程度或时间范围过滤事件。事件查询支持过去 30 天内 72 小时的窗口。

NetQ UI 可能需要几分钟才能处理并准确显示网络事件。延迟是由具有多个网络依赖关系的事件引起的。NetQ 需要 5 到 10 分钟才能整合并显示这些事件。

有关配置第三方应用程序以广播 NetQ 事件的信息,请参阅配置系统事件通知

事件命令

使用以下命令监控系统事件。有关其他选项、定义和示例,请参阅命令行参考

netq show events

在 UI 中监控事件

展开 菜单,然后选择 事件

仪表板显示事件的时间线以及导致最多事件的设备。您可以选择摘要上方的控件,按时间、设备(主机名)、类型、严重程度或状态过滤事件。选择控件下方的选项卡以显示全网事件、接口事件、网络服务事件、系统事件或阈值交叉事件。图表和表格会根据您选择的选项卡进行更新。

Events dashboard with networkwide error and info events.

当流式传输 验证检查 检测到故障时,也会生成事件。如果事件是由失败的验证检查生成的,则下次检查成功运行时,它将自动标记为已解决。

抑制事件

如果您收到太多事件通知,或者不希望 NetQ 显示已知问题或误报,则可以抑制这些事件。NetQ 不会在事件摘要仪表板中显示被抑制的事件,这实际上允许您忽略它们。除了您创建的用于抑制事件的规则之外,NetQ 默认情况下还会抑制某些事件。

您可以抑制以下类型的消息的事件

  • 自适应路由
  • BGP
  • BTRFS 信息(与 Cumulus Linux 中的 BTRFS 文件系统相关的事件)
  • 线缆
  • CL 支持(创建 cl-support script 时生成的事件)
  • 配置差异(配置文件更改时生成的事件)
  • EVPN
  • 已安装软件包
  • 生命周期管理
  • 链路(与链路相关的事件,包括状态和接口名称)
  • LLDP
  • MLAG
  • MTU
  • NetQ 代理
  • NTP
  • PTM
  • PTP
  • RoCE 配置
  • 运行配置差异(与两个配置之间的差异相关的事件)
  • 传感器
  • 服务(包括服务是活动还是非活动)
  • SSD 利用率(与交换机上的存储相关的事件)
  • 拓扑

NetQ 默认情况下会在 UI 中抑制严重级别为“info”的 BGP、EVPN、链路、线缆和传感器相关事件。如果您希望接收这些通知,可以禁用此规则

创建事件抑制配置

如果您在事件仪表板中看到您想要抑制的事件类型,请导航到事件抑制列,然后选择抑制事件。下面描述的向导将预先填充您的抑制条件。

要使用 NetQ UI 抑制事件

  1. 点击 菜单,然后点击 事件
  2. 在右上角,选择显示抑制规则
  3. 选择添加规则。您可以配置单独的抑制规则,也可以创建组规则来抑制所有消息类型的事件。
  1. 为您的规则命名并填写字段。然后选择创建

当您使用 CLI 添加新配置时,您可以指定一个范围,该范围按以下顺序限制抑制

  1. 主机名。
  2. 严重程度。
  3. 消息类型特定的过滤器。例如,EVPN 消息的目标 VNI,或链路消息的接口名称。

NetQ 预定义了一组过滤器条件。要查看这些条件,请运行 netq show events-config show-filter-conditions

cumulus@switch:~$ netq show events-config show-filter-conditions
Matching config_events records:
Message Name             Filter Condition Name                      Filter Condition Hierarchy                           Filter Condition Description
------------------------ ------------------------------------------ ---------------------------------------------------- --------------------------------------------------------
evpn                     vni                                        3                                                    Target VNI
evpn                     severity                                   2                                                    Severity error/info
evpn                     hostname                                   1                                                    Target Hostname
clsupport                fileAbsName                                3                                                    Target File Absolute Name
clsupport                severity                                   2                                                    Severity error/info
clsupport                hostname                                   1                                                    Target Hostname
link                     new_state                                  4                                                    up / down
link                     ifname                                     3                                                    Target Ifname
link                     severity                                   2                                                    Severity error/info
link                     hostname                                   1                                                    Target Hostname
ospf                     ifname                                     3                                                    Target Ifname
ospf                     severity                                   2                                                    Severity error/info
ospf                     hostname                                   1                                                    Target Hostname
sensor                   new_s_state                                4                                                    New Sensor State Eg. ok
sensor                   sensor                                     3                                                    Target Sensor Name Eg. Fan, Temp
sensor                   severity                                   2                                                    Severity error/info
sensor                   hostname                                   1                                                    Target Hostname
configdiff               old_state                                  5                                                    Old State
configdiff               new_state                                  4                                                    New State
configdiff               type                                       3                                                    File Name
configdiff               severity                                   2                                                    Severity error/info
configdiff               hostname                                   1                                                    Target Hostname
ssdutil                  info                                       3                                                    low health / significant health drop
ssdutil                  severity                                   2                                                    Severity error/info
ssdutil                  hostname                                   1                                                    Target Hostname
agent                    db_state                                   3                                                    Database State
agent                    severity                                   2                                                    Severity error/info
agent                    hostname                                   1                                                    Target Hostname
ntp                      new_state                                  3                                                    yes / no
ntp                      severity                                   2                                                    Severity error/info
ntp                      hostname                                   1                                                    Target Hostname
bgp                      vrf                                        4                                                    Target VRF
bgp                      peer                                       3                                                    Target Peer
bgp                      severity                                   2                                                    Severity error/info
bgp                      hostname                                   1                                                    Target Hostname
services                 new_status                                 4                                                    active / inactive
services                 name                                       3                                                    Target Service Name Eg.netqd, mstpd, zebra
services                 severity                                   2                                                    Severity error/info
services                 hostname                                   1                                                    Target Hostname
btrfsinfo                info                                       3                                                    high btrfs allocation space / data storage efficiency
btrfsinfo                severity                                   2                                                    Severity error/info
btrfsinfo                hostname                                   1                                                    Target Hostname
clag                     severity                                   2                                                    Severity error/info
clag                     hostname                                   1                                                    Target Hostname

例如,要创建一个名为 mybtrfs 的配置,该配置在 leaf01 上抑制 BTRFS 相关事件 10 分钟,请运行

netq add events-config events_config_name mybtrfs message_type btrfsinfo scope '[{"scope_name":"hostname","scope_value":"leaf01"},{"scope_name":"severity","scope_value":"*"}]' suppress_until 600

删除或禁用事件抑制规则

您可以删除或禁用抑制规则。删除规则后,事件通知将恢复。禁用抑制规则会暂停这些规则,使您可以临时接收事件通知。

要删除抑制的事件配置

  1. 点击 菜单,然后点击 事件
  2. 在页面顶部选择显示抑制规则
  3. SingleAll 选项卡之间切换,以交替查看一个抑制规则或一组规则。导航到您要删除或禁用的规则。
  4. 对于单个规则,单击三点菜单并选择删除。要暂停规则而不是删除它,请单击禁用。要删除一组规则,请单击三点菜单并选择删除。要禁用组内的单个规则,请选择查看全部,然后选择禁用

要删除事件抑制配置,请运行 netq del events-config 并包含抑制配置的标识符。

cumulus@switch:~$ netq del events-config events_config_id eventsconfig_10
Successfully deleted Events Config eventsconfig_10

显示事件抑制规则

要查看抑制的事件

  1. 点击 菜单,然后点击 事件
  2. 在页面顶部选择显示抑制规则
  3. SingleAll 选项卡之间切换,分别查看单个规则和规则组。

您可以使用 netq show events-config 命令查看所有事件抑制配置,或者按特定配置或消息类型进行过滤。

cumulus@switch:~$ netq show events-config events_config_id eventsconfig_1
Matching config_events records:
Events Config ID     Events Config Name   Message Type         Scope                                                        Active Suppress Until
-------------------- -------------------- -------------------- ------------------------------------------------------------ ------ --------------------
eventsconfig_1       job_cl_upgrade_2d89c agent                {"db_state":"*","hostname":"spine02","severity":"*"}         True   Tue Jul  7 16:16:20
                     21b3effd79796e585c35                                                                                          2020
                     096d5fc6cef32b463e37
                     cca88d8ee862ae104d5_
                     spine02
eventsconfig_1       job_cl_upgrade_2d89c bgp                  {"vrf":"*","peer":"*","hostname":"spine04","severity":"*"}   True   Tue Jul  7 16:16:20
                     21b3effd79796e585c35                                                                                          2020
                     096d5fc6cef32b463e37
                     cca88d8ee862ae104d5_
                     spine04
eventsconfig_1       job_cl_upgrade_2d89c btrfsinfo            {"hostname":"spine04","info":"*","severity":"*"}             True   Tue Jul  7 16:16:20
                     21b3effd79796e585c35                                                                                          2020
                     096d5fc6cef32b463e37
                     cca88d8ee862ae104d5_
                     spine04
eventsconfig_1       job_cl_upgrade_2d89c clag                 {"hostname":"spine04","severity":"*"}                        True   Tue Jul  7 16:16:20
                     21b3effd79796e585c35                                                                                          2020
                     096d5fc6cef32b463e37
                     cca88d8ee862ae104d5_
                     spine04
eventsconfig_1       job_cl_upgrade_2d89c clsupport            {"fileAbsName":"*","hostname":"spine04","severity":"*"}      True   Tue Jul  7 16:16:20
                     21b3effd79796e585c35                                                                                          2020
                     096d5fc6cef32b463e37
                     cca88d8ee862ae104d5_
                     spine04
...

当您按消息类型过滤时,您必须包含 show-filter-conditions 关键字,以显示与该消息类型关联的条件以及它们被处理的层次结构。

cumulus@switch:~$ netq show events-config message_type evpn show-filter-conditions
Matching config_events records:
Message Name             Filter Condition Name                      Filter Condition Hierarchy                           Filter Condition Description
------------------------ ------------------------------------------ ---------------------------------------------------- --------------------------------------------------------
evpn                     vni                                        3                                                    Target VNI
evpn                     severity                                   2                                                    Severity error/info
evpn                     hostname                                   1                                                    Target Hostname