NVIDIA cuFFTMp 文档¶
欢迎使用 cuFFTMp (cuFFT 多进程) 库。
您可以在这里找到
一份 快速入门 指南
一个 如何使用 cuFFTMp 章节,描述了 cuFFTMp 的需求和通用用法
一个 API 参考 章节,全面描述了 cuFFTMp 的所有 API
cuFFTMp 作为 NVIDIA HPC-SDK 的一部分发布。
亮点¶
2D 和 3D 分布式内存 FFT
Slab (1D) 和 Pencil (2D) 数据分解,具有任意块大小
兼容 MPI 的接口
使用 NVSHMEM 的低延迟实现,针对单节点和多节点 FFT 进行了优化
x86_64
和aarch64
支持 (参见 硬件和软件需求)
用户指南