3. FP8 内建函数
本节介绍 fp8 内建函数。
要使用这些函数,请在程序中包含头文件 cuda_fp8.h
。以下宏可帮助用户选择性地启用/禁用头文件中存在的各种定义
__CUDA_NO_FP8_CONVERSIONS__
- 如果定义,此宏将阻止使用头文件中定义的任何 C++ 类型转换(转换构造函数和转换运算符)。__CUDA_NO_FP8_CONVERSION_OPERATORS__
- 如果定义,此宏将阻止使用从fp8
到其他类型的 C++ 转换运算符。
组
- 用于处理 e4m3 类型的 fp8 数据类型的 C++ 结构体。
- 用于处理 e5m2 类型的 fp8 数据类型的 C++ 结构体。
- 用于处理 e4m3 类型的四个 fp8 值的向量类型的 C++ 结构体。
- 用于处理 e5m2 类型的四个 fp8 值的向量类型的 C++ 结构体。
- 用于处理 e8m0 类型的四个缩放因子的向量类型的 C++ 结构体。
- 用于处理 e4m3 类型的两个 fp8 值的向量类型的 C++ 结构体。
- 用于处理 e5m2 类型的两个 fp8 值的向量类型的 C++ 结构体。
- 用于处理 e8m0 类型的两个缩放因子的向量类型的 C++ 结构体。
- FP8 转换和数据移动
-
要使用这些函数,请在程序中包含头文件
cuda_fp8.h
。