1. FP4 内联函数
2. FP6 内联函数
3. FP8 内联函数
3.1. C++ 结构体,用于处理 e4m3 类型的 fp8 数据类型。
3.2. C++ 结构体,用于处理 e5m2 类型的 fp8 数据类型。
3.3. C++ 结构体,用于处理 e4m3 类型的四个 fp8 值的向量类型。
3.4. C++ 结构体,用于处理 e5m2 类型的四个 fp8 值的向量类型。
3.5. C++ 结构体,用于处理 e8m0 类型的四个比例因子的向量类型。
3.6. C++ 结构体,用于处理 e4m3 类型的两个 fp8 值的向量类型。
3.7. C++ 结构体,用于处理 e5m2 类型的两个 fp8 值的向量类型。
3.8. C++ 结构体,用于处理 e8m0 类型的两个比例因子的向量类型。
3.9. FP8 转换和数据移动
4. 半精度内联函数
5. Bfloat16 精度内联函数
6. 单精度数学函数
7. 单精度内联函数
8. 双精度数学函数
9. 双精度内联函数
10. FP128 四倍精度数学函数
11. 类型转换内联函数
12. 整数数学函数
13. 整数内联函数
14. SIMD 内联函数
15. 结构体
16. 声明
CUDA Math API 参考手册
»
3.
FP8 内联函数
»
3.2.
C++ 结构体,用于处理 e5m2 类型的 fp8 数据类型。
v12.8 |
PDF
|
存档
3.2.
C++ 结构体,用于处理 e5m2 类型的 fp8 数据类型。
结构体
__nv_fp8_e5m2
__nv_fp8_e5m2
数据类型