1. 简介
2. 浮点数
3. 点积:精度示例
4. CUDA 和浮点数
5. 异构世界的考量
6. 具体建议
7. 致谢
8. 参考文献
9. 通知
浮点数和 IEEE 754
»
目录
v12.8 |
PDF
|
存档
目录
白皮书,涵盖与 NVIDIA GPU 相关最常见的问题。
1. 简介
2. 浮点数
2.1. 格式
2.2. 运算和精度
2.3. 融合乘加运算 (FMA)
3. 点积:精度示例
3.1. 示例算法
3.2. 比较
4. CUDA 和浮点数
4.1. 计算能力 2.0 及以上
4.2. 舍入模式
4.3. 控制融合乘加运算
4.4. 编译器标志
4.5. 与 x86 的差异
5. 异构世界的考量
5.1. 数学函数精度
5.2. x87 和 SSE
5.3. 核心数量
5.4. 验证 GPU 结果
6. 具体建议
7. 致谢
8. 参考文献
9. 通知
9.1. 通知
9.2. OpenCL
9.3. 商标