NVIDIA cuFFTDx#
cuFFT 设备扩展库 (cuFFTDx) 使您能够在 CUDA 内核中执行快速傅里叶变换 (FFT) 计算。将 FFT 与其他操作融合可以减少延迟并提高应用程序的性能。
cuFFTDx 是 MathDx 软件包的一部分,该软件包还包括 cuBLASDx 库,该库提供选定的线性代数函数,如通用矩阵乘法 (GEMM)。这两个库旨在协同工作。包含这两个库的内核示例作为 cuBLASDx 示例包含在软件包中。在单个项目中使用多个设备扩展库时,它们都应来自同一 MathDx 版本。
本文档包含三个主要组成部分
快速入门指南,首次使用 cuFFTDx 进行 FFT。
cuFFTDx API 参考,全面概述了所提供的功能。
亮点#
cuFFTDx 库提供
可嵌入到 CUDA 内核中的快速傅里叶变换 (FFT) CUDA 函数。
高性能,无需不必要地从全局内存来回移动数据。
可定制性,可以根据不同需求(大小、精度、批次数量等)调整 FFT 例程的选择。
能够将 FFT 内核与其他操作融合,以节省全局内存访问。
与 CUDA 工具包未来版本的兼容性。