DOCA 文档 v2.10.0

DOCA DPA 统计工具

DOCA dpa-statistics 是一个 CLI 工具,允许用户监控和获取每个运行的 DPA 进程和线程的线程执行统计信息。该工具用于公开有关运行的 DPA 进程和线程的信息,并收集有关 DPA 线程性能的统计信息。

该工具显示正在运行的 DPA 线程的性能信息,包括在一段时间内执行的周期数和指令数。该工具能够启动和停止统计信息的收集,并显示每个线程收集的数据。

信息

dpa-ps 工具的进程 ID 输出可以用作 dpa-statistics 工具的输入参数。

信息

此工具仅支持 NVIDIA® BlueField®-3。

collect 命令在四种互斥模式下工作

  • 启用模式 – 开始收集性能数据

  • 禁用模式 – 停止收集性能数据

  • 超时模式 – 开始收集,等待超时,停止收集并打印信息。用户可以使用 Ctrl-C 命令中断等待,然后超时将被取消,工具将禁用统计信息收集并打印包含实际收集操作时间的信息。

  • 无限模式 – 没有特殊标志。与超时模式相同,但具有无限超时。该工具等待 Ctrl-C 命令停止。

下表列出了 collect 命令的标志和参数

短选项

长选项

描述

-h

--help

帮助信息

-d

--device

设备接口名称 (MST/RDMA)

-p

--process-id

用于过滤的十六进制进程 ID

信息

此标志指示命令要操作的特定命令。否则,将从所有进程收集统计信息。

-i

--suppress-header-info

抑制打印标头信息

-n

--enable

启用收集信息

-o

--disable

禁用收集信息

-t

--timeout

启用收集,等待超时,禁用收集并打印信息

信息

超时值以毫秒为单位。

输入超时值的示例

  • 45 – 45 毫秒

  • 45.55 – 45 毫秒和 550,000 纳秒

  • .0005 – 500 纳秒

  • 45m55n – 45 毫秒和 55 纳秒

  • 66n – 66 纳秒

-r

--reset

在操作开始收集操作之前重置计数器

呈现性能统计信息在启动数据收集后适用。

下表列出了 show 命令的标志和参数

短选项

长选项

描述

-h

--help

帮助信息

-d

--device

设备接口名称 (MST/RDMA)

-p

--process-id

用于过滤的十六进制进程 ID

-i

--suppress-header-info

抑制打印标头信息

输出示例

复制
已复制!
            

$ sudo ./dpa-statistics show -d mlx5_0 -p 1 ProcessID Process Name    ThreadID Cycles Instruction Time Executions Thread Name 1            PROCESS_1   3 266268 18193 164 41 EH_1_0_0   4 411571 32727 252 47                 EH_1_1_1

其中

  • ProcessID – 线程所属的 dpa_process_object_id

  • Process Name – 线程所属的 dpa_process_name

  • ThreadID – DPA 线程对象 ID

  • Cycles – 线程使用的总 EU 周期数

  • Instruction – 线程执行的指令总数

  • Time – 线程处于活动状态的总时间(以时钟滴答为单位)

  • Executions – 线程调用的总次数

  • Thread Namedpa_thread_name

示例

  • 进程 0 的无限模式下 collect 的示例,并抑制标头信息

    复制
    已复制!
                

    $ sudo ./dpa-statistics collect -d mlx5_0 -p 0 -i ...^C Data collected for 4606 milliseconds 0 nanoseconds 0           PROCESS_0   5 223964 13754 140 31         EH_0_5_5   6 190130 13754 114 31         EH_0_6_6

  • 超时为 1 秒半毫秒的超时模式下 collect 的示例。

    复制
    已复制!
                

    $ sudo ./dpa-statistics collect -d mlx5_0 -t 1000.500 Data collected for 1000 milliseconds 500000 nanoseconds ProcessID Process Name   ThreadID Cycles Instruction Time Executions Thread Name 0            PROCESS_0   5 223964 13754 140 31                 EH_0_5_5   6 190130 13754 114 31                 EH_0_6_6 1            PROCESS_1   3 266268 18193 164 41                 EH_1_3_3   4 411571 32727 252 47                 EH_1_4_4 2            PROCESS_2 3            PROCESS_3   0 223205 13754 137 31                 EH_3_0_0   1 189896 13754 113 31                 EH_3_1_1   2 191796 13754 117 31                 EH_3_2_2 4            PROCESS_4

  • 启用统计信息收集并重置计数器的示例。

    复制
    已复制!
                

    $ sudo ./dpa-statistics collect -d mlx5_0 -n -r

  • 禁用统计信息收集的示例。

    复制
    已复制!
                

    $ sudo ./dpa-statistics collect -d mlx5_0 -o

  • 读取大型统计信息计数器块需要很长时间

  • dpa-psdpa-statistics 工具不能在同一设备上同时运行

© 版权所有 2025, NVIDIA。 上次更新于 2025 年 2 月 12 日。