1. NVIDIA Hopper 调优指南
2. 修订历史
3. 公告
Hopper 调优指南
»
目录
v12.8 |
PDF
|
Archive
目录
1. NVIDIA Hopper 调优指南
1.1. NVIDIA Hopper GPU 架构
1.2. CUDA 最佳实践
1.3. 应用程序兼容性
1.4. NVIDIA Hopper 调优
1.4.1. 流式多处理器
1.4.1.1. 占用率
1.4.1.2. Tensor 内存加速器
1.4.1.3. 线程块集群
1.4.1.4. 改进的 FP32 吞吐量
1.4.1.5. 动态编程指令
1.4.2. 内存系统
1.4.2.1. 高带宽内存 HBM3 子系统
1.4.2.2. 增加的 L2 容量
1.4.2.3. 内联压缩
1.4.2.4. 统一共享内存/L1/纹理缓存
1.4.3. 第四代 NVLink
2. 修订历史
3. 公告
3.1. 公告
3.2. OpenCL
3.3. 商标