1. 准备应用程序以进行性能分析
2. Visual Profiler(可视化性能分析器)
3. nvprof
4. 远程性能分析
5. NVIDIA 工具扩展
6. MPI 性能分析
7. MPS 性能分析
8. 依赖性分析
9. 指标参考
10. Warp 状态
11. 从 Visual Profiler 和 nvprof 迁移到 Nsight Tools
12. 性能分析器已知问题
13. 更新日志
14. 声明
性能分析器
»
目录
v12.8 |
PDF
|
存档
目录
1. 准备应用程序以进行性能分析
1.1. 聚焦性能分析
1.2. 标记 CPU 活动区域
1.3. 命名 CPU 和 CUDA 资源
1.4. 刷新性能分析数据
1.5. 性能分析 CUDA Fortran 应用程序
2. Visual Profiler(可视化性能分析器)
2.1. 入门
2.1.1. 设置 Java 运行时环境
2.1.2. 安装 JRE
2.1.3. 修改您的应用程序以进行性能分析
2.1.4. 创建会话
2.1.5. 分析您的应用程序
2.1.6. 探索时间线
2.1.7. 查看详细信息
2.1.8. 改进大型性能分析文件的加载
2.2. 会话
2.2.1. 可执行会话
2.2.2. 导入会话
2.2.2.1. 导入单进程
nvprof
会话
2.2.2.2. 导入多进程
nvprof
会话
2.2.2.3. 导入命令行性能分析器会话
2.3. 应用程序要求
2.4. Visual Profiler 视图
2.4.1. 时间线视图
2.4.1.1. 时间线控件
2.4.1.2. 导航时间线
2.4.1.3. 时间线刷新
2.4.1.4. 依赖性分析控件
2.4.2. 分析视图
2.4.2.1. 引导式应用程序分析
2.4.2.2. 非引导式应用程序分析
2.4.2.3. PC 采样视图
2.4.2.4. 内存统计信息
2.4.2.5. NVLink 视图
2.4.3. 源代码-反汇编视图
2.4.4. GPU 详细信息视图
2.4.5. CPU 详细信息视图
2.4.6. OpenACC 详细信息视图
2.4.7. OpenMP 详细信息视图
2.4.8. 属性视图
2.4.9. 控制台视图
2.4.10. 设置视图
2.4.11. CPU 源代码视图
2.5. 自定义性能分析器
2.5.1. 调整视图大小
2.5.2. 重新排序视图
2.5.3. 移动视图
2.5.4. 取消停靠视图
2.5.5. 打开和关闭视图
2.6. 命令行参数
3. nvprof
3.1. 命令行选项
3.1.1. CUDA 性能分析选项
3.1.2. CPU 性能分析选项
3.1.3. 打印选项
3.1.4. IO 选项
3.2. 性能分析模式
3.2.1. 摘要模式
3.2.2. GPU-Trace 和 API-Trace 模式
3.2.3. 事件/指标摘要模式
3.2.4. 事件/指标跟踪模式
3.3. 性能分析控制
3.3.1. 超时
3.3.2. 并发内核
3.3.3. 性能分析范围
3.3.4. 多进程性能分析
3.3.5. 系统性能分析
3.3.6. 统一内存性能分析
3.3.7. CPU 线程跟踪
3.4. 输出
3.4.1. 调整单位
3.4.2. CSV
3.4.3. 导出/导入
3.4.4. 符号解析
3.4.5. 重定向输出
3.4.6. 依赖性分析
3.5. CPU 采样
3.5.1. CPU 采样限制
3.6. OpenACC
3.6.1. OpenACC 选项
3.6.2. OpenACC 摘要模式
3.7. OpenMP
3.7.1. OpenMP 选项
4. 远程性能分析
4.1. 使用 Visual Profiler 进行远程性能分析
4.1.1. 一跳远程性能分析
4.2. 使用
nvprof
进行远程性能分析
4.2.1. 在远程系统上收集数据
4.2.2. 查看和分析数据
5. NVIDIA 工具扩展
5.1. NVTX API 概述
5.2. NVTX API 事件
5.2.1. NVTX 标记
5.2.2. NVTX 范围开始/停止
5.2.3. NVTX 范围推入/弹出
5.2.4. 事件属性结构
5.2.5. NVTX 同步标记
5.3. NVTX 域
5.4. NVTX 资源命名
5.5. NVTX 字符串注册
6. MPI 性能分析
6.1. 使用 NVTX 自动 MPI 注释
6.2. 手动 MPI 性能分析
6.3. 进一步阅读
7. MPS 性能分析
7.1. 使用 Visual Profiler 进行 MPS 性能分析
7.2. 使用 nvprof 进行 MPS 性能分析
7.3. 在 Visual Profiler 中查看 nvprof MPS 时间线
8. 依赖性分析
8.1. 背景
8.2. 指标
8.3. 支持
8.4. 限制
9. 指标参考
9.1. 针对 Capability 5.x 的指标
9.2. 针对 Capability 6.x 的指标
9.3. 针对 Capability 7.x 的指标
10. Warp 状态
11. 从 Visual Profiler 和 nvprof 迁移到 Nsight Tools
12. 性能分析器已知问题
13. 更新日志
14. 声明
14.1. 声明
14.2. OpenCL
14.3. 商标