1. FP4 内在函数
2. FP6 内在函数
3. FP8 内在函数
3.1. 用于处理 e4m3 类型的 fp8 数据类型的 C++ 结构体。
3.2. 用于处理 e5m2 类型的 fp8 数据类型的 C++ 结构体。
3.3. 用于处理 e4m3 类型的四个 fp8 值的向量类型的 C++ 结构体。
3.4. 用于处理 e5m2 类型的四个 fp8 值的向量类型的 C++ 结构体。
3.5. 用于处理 e8m0 类型的四个比例因子的向量类型的 C++ 结构体。
3.6. 用于处理 e4m3 类型的两个 fp8 值的向量类型的 C++ 结构体。
3.7. 用于处理 e5m2 类型的两个 fp8 值的向量类型的 C++ 结构体。
3.8. 用于处理 e8m0 类型的两个比例因子的向量类型的 C++ 结构体。
3.9. FP8 转换和数据移动
4. 半精度内在函数
5. Bfloat16 精度内在函数
6. 单精度数学函数
7. 单精度内在函数
8. 双精度数学函数
9. 双精度内在函数
10. FP128 四倍精度数学函数
11. 类型转换内在函数
12. 整数数学函数
13. 整数内在函数
14. SIMD 内在函数
15. 结构体
16. 通知
CUDA Math API 参考手册
»
3.
FP8 内在函数
»
3.4.
用于处理 e5m2 类型的四个 fp8 值的向量类型的 C++ 结构体。
v12.8 |
PDF
|
存档
3.4.
用于处理 e5m2 类型的四个 fp8 值的向量类型的 C++ 结构体。
结构体
__nv_fp8x4_e5m2
__nv_fp8x4_e5m2
数据类型