Logo
  • 1. NVIDIA Hopper 调优指南
  • 2. 修订历史
  • 3. 公告
Hopper 调优指南
  • »
  • 目录
  • v12.8 | PDF | Archive  

目录

  • 1. NVIDIA Hopper 调优指南
    • 1.1. NVIDIA Hopper GPU 架构
    • 1.2. CUDA 最佳实践
    • 1.3. 应用程序兼容性
    • 1.4. NVIDIA Hopper 调优
      • 1.4.1. 流式多处理器
        • 1.4.1.1. 占用率
        • 1.4.1.2. Tensor 内存加速器
        • 1.4.1.3. 线程块集群
        • 1.4.1.4. 改进的 FP32 吞吐量
        • 1.4.1.5. 动态编程指令
      • 1.4.2. 内存系统
        • 1.4.2.1. 高带宽内存 HBM3 子系统
        • 1.4.2.2. 增加的 L2 容量
        • 1.4.2.3. 内联压缩
        • 1.4.2.4. 统一共享内存/L1/纹理缓存
      • 1.4.3. 第四代 NVLink
  • 2. 修订历史
  • 3. 公告
    • 3.1. 公告
    • 3.2. OpenCL
    • 3.3. 商标

隐私政策 | 管理我的隐私 | 请勿出售或分享我的数据 | 服务条款 | 辅助功能 | 公司政策 | 产品安全 | 联系我们

版权所有 © 2022-2025,NVIDIA Corporation 及附属公司。保留所有权利。

上次更新日期:2025 年 1 月 21 日。

© . All rights reserved.