流分析

创建流分析以从您环境中的 TCP 和 UDP 流中采样数据,并查看跨网络路径的延迟和缓冲区利用率统计信息。

NVIDIA Spectrum-2 交换机及更高版本支持流分析。它需要运行 Cumulus Linux 5.0 或更高版本的交换机结构。您必须启用生命周期管理 (LCM) 才能运行流分析。如果 LCM 被禁用,您将不会在 UI 中看到流分析图标。默认情况下,本地部署启用 LCM,而云部署默认禁用 LCM。请联系您当地的 NVIDIA 销售代表或提交支持票证以在云部署上激活 LCM。

创建新的流分析

  1. 要启动新的流分析,请在标题中选择流分析,然后选择创建新的流分析

  2. 输入流分析参数,包括您希望分析的流的源 IP 地址、目标 IP 地址、源端口和目标端口。从下拉菜单中选择流的协议和 VRF。

flow analysis wizard prompting user to enter application parameters
  1. 输入应用程序参数后,输入监控设置,包括采样率和时间参数。
flow analysis wizard prompting user to enter sampling and scheduling information

运行流分析会影响交换机 CPU 性能。对于大容量流,请设置较低的采样率以限制交换机 CPU 影响。

如果您尝试运行包含分配了默认的、未修改的访问配置文件的交换机的流分析,则该过程将失败。创建唯一的访问配置文件(或使用唯一的凭据更新默认配置文件),然后将配置文件分配给您要包含在流分析中的交换机。

  1. 启动流分析后,流分析卡将出现在 NetQ 工作台上。

查看流分析数据

  1. 要查看之前的流分析,请在标题中选择流分析,然后选择查看之前的流分析

  2. 选择流分析名称旁边的查看详情以显示分析仪表板。您可以使用此仪表板查看受监控流的延迟和缓冲区统计信息。如果启用了双向监控,您可以通过选择 图标来查看流的反向方向。

仪表板标题显示受监控的流设置

dashboard header displaying settings and paramters selected with the flow analysis wizard
流设置描述
生命周期流分析的生命周期。此示例在 11 分钟内完成。
源 IP流的源 IP 地址。在此示例中,它是 10.1.100.125。
目标 IP流的目标 IP 地址。在此示例中,它是 10.1.10.105。
源端口流的源端口。在此示例中,它显示 N/A,因为它未设置。
目标端口流的目标端口。在此示例中,它是 2222。
协议受监控流的协议。在此示例中,它是 UDP。
采样率流的采样率。在此示例中,它是低。
VRF流所在的 VRF。在此示例中,它是默认 VRF。
双向监控这确定是否在源 IP 地址和目标 IP 地址之间的两个方向上监控流。在此示例中,它已启用。单击 以更改显示的方向。

了解流分析图

流分析图根据跨设备测得的值进行颜色编码。较低的值以绿色显示,较高的值以橙色显示。颜色渐变显示在图表下方,以及从收集的流数据中得出的低值和高值。路径中的每个跃点在图表中都以垂直的灰色条纹线表示,并标有主机名。以下示例显示单条路径

single-path flow analysis with five hops ranging from low to high values

仪表板右侧的流图面板显示沿选定路径的设备。

flow graph panel showing the five devices associated with the flow analysis graph

查看流延迟

流分析测量的延迟是采样数据包通过各个设备的总传输时间。每个设备的测量延迟摘要显示在主流分析图上方。

three devices displaying their average latencies, including minimum, maximum and P95 value.

流中数据包的平均延迟显示在每个设备的主机名下方,以及分析生命周期内观察到的最小和最大延迟。还显示了采样数据包的第 95 个百分位数 (P95) 延迟值。P95 计算意味着 95% 的采样数据包的延迟值小于或等于计算值。

使用光标悬停在主分析图的各个部分上,以查看路径中每个设备的平均延迟值。

cursor hovering over a device to show latency values

流分析仪表板的左侧面板还显示该路径上每个设备的测量延迟时间线。使用光标悬停在每个设备时间线上的绘制数据点上,以查看每个时间间隔测量的延迟。

a cursor hovering over a device's timeline showing maximum, minimum, and average latency at 6:15 AM on November 24th 2021

查看缓冲区占用率

主流分析仪表板还显示路径上每个设备的缓冲区占用率。要更改图表视图以显示流的缓冲区占用率,请单击平均流延迟旁边的 并选择平均缓冲区占用率。您可以查看缓冲区占用率的概览图,或选择每个设备以查看分析流的缓冲区占用率

overview graph displaying average buffer occupancy between 8 total devices

百分比表示在分析运行时,分析流占用的交换机上的缓冲区空间量。

buffer occupancy displaying percentages at 0

查看多条路径

当与流设置匹配的数据包遍历拓扑中的多条路径时,流图会显示每条路径的延迟和缓冲区占用率

flow graph displaying multiple paths along with latency and buffer-occupancy data along those paths

您可以通过单击流图面板中的备用路径,或单击主分析图上未选中的路径来在路径之间切换

flow graph panel highlighting a selected path with several unselected paths also displayed

在仪表板左侧的详细信息面板中,您可以选择一条路径来查看数据包在每条路径上分配的百分比。

a selected path showing that 50.1% of packets are distributed over that path

部分路径支持

如果某些流遍历的网络路径包含缺少流分析支持的交换机,则仍可以分析这些流。在以下情况下支持部分路径流分析

  • 不受支持的设备不能是分析流的初始入口或终止出口设备。
  • 如果路径中有多个连续的传输设备缺少流分析支持,则路径发现将在拓扑中的该点终止,并且某些设备将不会显示在流图中。

不受支持的设备在流分析图中表示为带有红色 x 的黑色条。不显示该设备的流统计信息。

flow analysis graph showing an unsupported switch

如果多个连续交换机不支持流分析,则路径发现将终止。当可以从发现路径之外的交换机获得其他数据时,您可以从页面顶部的菜单中查看来自这些设备的数据

menu displaying three unsupported devices

左侧面板显示数据以及入口和出口端口。

查看设备统计信息

您可以通过单击流图面板中的设备,或单击主流分析图中与设备关联的线来查看每个设备的延迟、缓冲区占用率、接口统计信息、资源利用率和 WJH 事件。然后,左侧面板将更新以反映各个设备的统计信息。

panel displaying statistics of a selected device

选择设备后,单击 以展开统计图表

a cursor hovering over an icon that, when selected, expands the chart

在此视图中,您可以选择其他类别以添加到图表中

expanded chart displaying latency and WJH data, with buffer occupancy and total packet unselected and therefore not dispayed

流图面板允许您访问拓扑视图,您还可以在其中单击路径和设备以查看统计信息。单击在拓扑中查看以切换到拓扑视图。

topology view showing both selected and unselected devices and their paths

查看 WJH 事件

流分析监控路径中的 WJH 事件,并记录流的任何丢弃。在流分析图中,记录了 WJH 事件的交换机表示为带有白色条纹的红色条。将鼠标悬停在设备上以查看 WJH 事件摘要

a user hovering over a device in the main flow analysis graph with a WJH event summary showing 94,300 total packet drops

您还可以在流图面板中查看具有 WJH 事件的设备

a user hovering over a device in the flow graph panel with a WJH event summary showing 94,300 total packet drops

单击具有 WJH 事件的设备以在左侧面板中查看统计信息。将鼠标悬停在数据上以显示随时间推移的丢弃类型

invdividual device WJH statistics showing 2673 router drops

也可以通过选择 WJH 类别从展开的设备图表中查看 WJH 丢弃

expanded device chart showing WJH data of 24 total router drops

选择显示所有丢弃以显示设备的所有 WJH 丢弃列表

WJH statistics for all drops, including tabular information on count, drop type, drop reason, severity, and corrective action