1. Pascal 调优指南
2. 修订历史
3. 通知
Pascal 调优指南
»
目录
v12.8 |
PDF
|
存档
目录
白皮书,涵盖与 NVIDIA GPU 相关的最常见问题。
1. Pascal 调优指南
1.1. NVIDIA Pascal 计算架构
1.2. CUDA 最佳实践
1.3. 应用程序兼容性
1.4. Pascal 调优
1.4.1. 流式多处理器
1.4.1.1. 指令调度
1.4.1.2. 占用率
1.4.2. 新的算术原语
1.4.2.1. FP16 算术支持
1.4.2.2. INT8 点积
1.4.3. 内存吞吐量
1.4.3.1. 高带宽内存 2 DRAM
1.4.3.2. 统一 L1/纹理缓存
1.4.4. 原子内存操作
1.4.5. 共享内存
1.4.5.1. 共享内存容量
1.4.5.2. 共享内存带宽
1.4.6. GPU 间通信
1.4.6.1. NVLink 互连
1.4.6.2. GPUDirect RDMA 带宽
1.4.7. 计算抢占
1.4.8. 统一内存改进
2. 修订历史
3. 通知
3.1. 注意事项
3.2. OpenCL
3.3. 商标