Logo
  • 1. 简介
  • 2. 浮点数
  • 3. 点积:精度示例
  • 4. CUDA 和浮点数
  • 5. 异构世界的考量
  • 6. 具体建议
  • 7. 致谢
  • 8. 参考文献
  • 9. 通知
浮点数和 IEEE 754
  • »
  • 目录
  • v12.8 | PDF | 存档  

目录

白皮书,涵盖与 NVIDIA GPU 相关最常见的问题。

  • 1. 简介
  • 2. 浮点数
    • 2.1. 格式
    • 2.2. 运算和精度
    • 2.3. 融合乘加运算 (FMA)
  • 3. 点积:精度示例
    • 3.1. 示例算法
    • 3.2. 比较
  • 4. CUDA 和浮点数
    • 4.1. 计算能力 2.0 及以上
    • 4.2. 舍入模式
    • 4.3. 控制融合乘加运算
    • 4.4. 编译器标志
    • 4.5. 与 x86 的差异
  • 5. 异构世界的考量
    • 5.1. 数学函数精度
    • 5.2. x87 和 SSE
    • 5.3. 核心数量
    • 5.4. 验证 GPU 结果
  • 6. 具体建议
  • 7. 致谢
  • 8. 参考文献
  • 9. 通知
    • 9.1. 通知
    • 9.2. OpenCL
    • 9.3. 商标

隐私政策 | 管理我的隐私 | 请勿出售或分享我的数据 | 服务条款 | 辅助功能 | 公司政策 | 产品安全 | 联系我们

版权所有 © 2011-2025,NVIDIA Corporation 及附属公司。保留所有权利。

最后更新于 2025 年 1 月 21 日。

© . All rights reserved.