监控事件
使用 UI 或 CLI 监控事件:您可以查看整个网络中的所有事件或设备上的所有事件,然后根据事件类型、严重程度或时间范围过滤事件。事件查询支持过去 30 天内 72 小时的窗口。
NetQ UI 可能需要几分钟才能处理并准确显示网络事件。延迟是由具有多个网络依赖关系的事件引起的。NetQ 需要 5 到 10 分钟才能整合并显示这些事件。
有关配置第三方应用程序以广播 NetQ 事件的信息,请参阅配置系统事件通知。
事件命令
使用以下命令监控系统事件。有关其他选项、定义和示例,请参阅命令行参考。
netq show events
在 UI 中监控事件
展开 菜单,然后选择 事件。
仪表板显示事件的时间线以及导致最多事件的设备。您可以选择摘要上方的控件,按时间、设备(主机名)、类型、严重程度或状态过滤事件。选择控件下方的选项卡以显示全网事件、接口事件、网络服务事件、系统事件或阈值交叉事件。图表和表格会根据您选择的选项卡进行更新。

当流式传输 验证检查 检测到故障时,也会生成事件。如果事件是由失败的验证检查生成的,则下次检查成功运行时,它将自动标记为已解决。
抑制事件
如果您收到太多事件通知,或者不希望 NetQ 显示已知问题或误报,则可以抑制这些事件。NetQ 不会在事件摘要仪表板中显示被抑制的事件,这实际上允许您忽略它们。除了您创建的用于抑制事件的规则之外,NetQ 默认情况下还会抑制某些事件。
您可以抑制以下类型的消息的事件
- 自适应路由
- BGP
- BTRFS 信息(与 Cumulus Linux 中的 BTRFS 文件系统相关的事件)
- 线缆
- CL 支持(创建
cl-support script
时生成的事件) - 配置差异(配置文件更改时生成的事件)
- EVPN
- 已安装软件包
- 生命周期管理
- 链路(与链路相关的事件,包括状态和接口名称)
- LLDP
- MLAG
- MTU
- NetQ 代理
- NTP
- PTM
- PTP
- RoCE 配置
- 运行配置差异(与两个配置之间的差异相关的事件)
- 传感器
- 服务(包括服务是活动还是非活动)
- SSD 利用率(与交换机上的存储相关的事件)
- 拓扑
NetQ 默认情况下会在 UI 中抑制严重级别为“info”的 BGP、EVPN、链路、线缆和传感器相关事件。如果您希望接收这些通知,可以禁用此规则。
创建事件抑制配置
如果您在事件仪表板中看到您想要抑制的事件类型,请导航到事件抑制列,然后选择抑制事件。下面描述的向导将预先填充您的抑制条件。
要使用 NetQ UI 抑制事件
- 点击
菜单,然后点击 事件。
- 在右上角,选择显示抑制规则。
- 选择添加规则。您可以配置单独的抑制规则,也可以创建组规则来抑制所有消息类型的事件。

- 为您的规则命名并填写字段。然后选择创建。
当您使用 CLI 添加新配置时,您可以指定一个范围,该范围按以下顺序限制抑制
- 主机名。
- 严重程度。
- 消息类型特定的过滤器。例如,EVPN 消息的目标 VNI,或链路消息的接口名称。
NetQ 预定义了一组过滤器条件。要查看这些条件,请运行 netq show events-config show-filter-conditions
cumulus@switch:~$ netq show events-config show-filter-conditions
Matching config_events records:
Message Name Filter Condition Name Filter Condition Hierarchy Filter Condition Description
------------------------ ------------------------------------------ ---------------------------------------------------- --------------------------------------------------------
evpn vni 3 Target VNI
evpn severity 2 Severity error/info
evpn hostname 1 Target Hostname
clsupport fileAbsName 3 Target File Absolute Name
clsupport severity 2 Severity error/info
clsupport hostname 1 Target Hostname
link new_state 4 up / down
link ifname 3 Target Ifname
link severity 2 Severity error/info
link hostname 1 Target Hostname
ospf ifname 3 Target Ifname
ospf severity 2 Severity error/info
ospf hostname 1 Target Hostname
sensor new_s_state 4 New Sensor State Eg. ok
sensor sensor 3 Target Sensor Name Eg. Fan, Temp
sensor severity 2 Severity error/info
sensor hostname 1 Target Hostname
configdiff old_state 5 Old State
configdiff new_state 4 New State
configdiff type 3 File Name
configdiff severity 2 Severity error/info
configdiff hostname 1 Target Hostname
ssdutil info 3 low health / significant health drop
ssdutil severity 2 Severity error/info
ssdutil hostname 1 Target Hostname
agent db_state 3 Database State
agent severity 2 Severity error/info
agent hostname 1 Target Hostname
ntp new_state 3 yes / no
ntp severity 2 Severity error/info
ntp hostname 1 Target Hostname
bgp vrf 4 Target VRF
bgp peer 3 Target Peer
bgp severity 2 Severity error/info
bgp hostname 1 Target Hostname
services new_status 4 active / inactive
services name 3 Target Service Name Eg.netqd, mstpd, zebra
services severity 2 Severity error/info
services hostname 1 Target Hostname
btrfsinfo info 3 high btrfs allocation space / data storage efficiency
btrfsinfo severity 2 Severity error/info
btrfsinfo hostname 1 Target Hostname
clag severity 2 Severity error/info
clag hostname 1 Target Hostname
例如,要创建一个名为 mybtrfs
的配置,该配置在 leaf01 上抑制 BTRFS 相关事件 10 分钟,请运行
netq add events-config events_config_name mybtrfs message_type btrfsinfo scope '[{"scope_name":"hostname","scope_value":"leaf01"},{"scope_name":"severity","scope_value":"*"}]' suppress_until 600
删除或禁用事件抑制规则
您可以删除或禁用抑制规则。删除规则后,事件通知将恢复。禁用抑制规则会暂停这些规则,使您可以临时接收事件通知。
要删除抑制的事件配置
- 点击
菜单,然后点击 事件。
- 在页面顶部选择显示抑制规则。
- 在 Single 和 All 选项卡之间切换,以交替查看一个抑制规则或一组规则。导航到您要删除或禁用的规则。
- 对于单个规则,单击三点菜单并选择删除。要暂停规则而不是删除它,请单击禁用。要删除一组规则,请单击三点菜单并选择删除。要禁用组内的单个规则,请选择查看全部,然后选择禁用。
要删除事件抑制配置,请运行 netq del events-config 并包含抑制配置的标识符。
cumulus@switch:~$ netq del events-config events_config_id eventsconfig_10
Successfully deleted Events Config eventsconfig_10
显示事件抑制规则
要查看抑制的事件
- 点击
菜单,然后点击 事件。
- 在页面顶部选择显示抑制规则。
- 在 Single 和 All 选项卡之间切换,分别查看单个规则和规则组。
您可以使用 netq show events-config 命令查看所有事件抑制配置,或者按特定配置或消息类型进行过滤。
cumulus@switch:~$ netq show events-config events_config_id eventsconfig_1
Matching config_events records:
Events Config ID Events Config Name Message Type Scope Active Suppress Until
-------------------- -------------------- -------------------- ------------------------------------------------------------ ------ --------------------
eventsconfig_1 job_cl_upgrade_2d89c agent {"db_state":"*","hostname":"spine02","severity":"*"} True Tue Jul 7 16:16:20
21b3effd79796e585c35 2020
096d5fc6cef32b463e37
cca88d8ee862ae104d5_
spine02
eventsconfig_1 job_cl_upgrade_2d89c bgp {"vrf":"*","peer":"*","hostname":"spine04","severity":"*"} True Tue Jul 7 16:16:20
21b3effd79796e585c35 2020
096d5fc6cef32b463e37
cca88d8ee862ae104d5_
spine04
eventsconfig_1 job_cl_upgrade_2d89c btrfsinfo {"hostname":"spine04","info":"*","severity":"*"} True Tue Jul 7 16:16:20
21b3effd79796e585c35 2020
096d5fc6cef32b463e37
cca88d8ee862ae104d5_
spine04
eventsconfig_1 job_cl_upgrade_2d89c clag {"hostname":"spine04","severity":"*"} True Tue Jul 7 16:16:20
21b3effd79796e585c35 2020
096d5fc6cef32b463e37
cca88d8ee862ae104d5_
spine04
eventsconfig_1 job_cl_upgrade_2d89c clsupport {"fileAbsName":"*","hostname":"spine04","severity":"*"} True Tue Jul 7 16:16:20
21b3effd79796e585c35 2020
096d5fc6cef32b463e37
cca88d8ee862ae104d5_
spine04
...
当您按消息类型过滤时,您必须包含 show-filter-conditions
关键字,以显示与该消息类型关联的条件以及它们被处理的层次结构。
cumulus@switch:~$ netq show events-config message_type evpn show-filter-conditions
Matching config_events records:
Message Name Filter Condition Name Filter Condition Hierarchy Filter Condition Description
------------------------ ------------------------------------------ ---------------------------------------------------- --------------------------------------------------------
evpn vni 3 Target VNI
evpn severity 2 Severity error/info
evpn hostname 1 Target Hostname