NVIDIA Holoscan SDK v2.9.0

NSight Systems 分析

Holoscan SDK 已使用 NVTX API 进行注释,以提供关键应用程序调用的运行时跟踪和分析,例如对应用程序使用的操作符进行的 startcomputestop 回调。可以使用 NSight Systems 提供的工具捕获和可视化此分析。

要启用分析并输出运行应用程序的分析结果,请启用 HOLOSCAN_ENABLE_PROFILE 环境变量,并使用 NSight Systems 提供的 nsys 运行时来运行应用程序。例如,以下命令将分析 bring_your_own_model 示例应用程序的前 3 秒,并将结果写入 byom_profile.nsys-rep

复制
已复制!
            

export HOLOSCAN_ENABLE_PROFILE=1 nsys profile -t cuda,nvtx,osrt -o byom_profile -f true -d 3 python3 ./examples/bring_your_own_model/python/byom.py

然后可以使用 NSight Systems UI (nsys-ui) 打开写入的分析文件以可视化结果。这是一个 bring your own model 示例应用程序的示例分析文件,放大显示了应用程序操作符的 CPU 和 CUDA 运行时的详细信息

byom_nsys_profile.png

图 24 bring_your_own_model 示例应用程序的示例分析文件

上一篇 GXF 作业统计信息
下一篇 视频管道延迟工具
© 版权所有 2022-2024,NVIDIA。 上次更新于 2025 年 1 月 27 日。