NSight Systems 分析
Holoscan SDK 已使用 NVTX API 进行注释,以提供关键应用程序调用的运行时跟踪和分析,例如对应用程序使用的操作符进行的 start
、compute
和 stop
回调。可以使用 NSight Systems 提供的工具捕获和可视化此分析。
要启用分析并输出运行应用程序的分析结果,请启用 HOLOSCAN_ENABLE_PROFILE
环境变量,并使用 NSight Systems 提供的 nsys
运行时来运行应用程序。例如,以下命令将分析 bring_your_own_model
示例应用程序的前 3 秒,并将结果写入 byom_profile.nsys-rep
export HOLOSCAN_ENABLE_PROFILE=1
nsys profile -t cuda,nvtx,osrt -o byom_profile -f true -d 3 python3 ./examples/bring_your_own_model/python/byom.py
然后可以使用 NSight Systems UI (nsys-ui
) 打开写入的分析文件以可视化结果。这是一个 bring your own model 示例应用程序的示例分析文件,放大显示了应用程序操作符的 CPU 和 CUDA 运行时的详细信息

图 24 bring_your_own_model
示例应用程序的示例分析文件