NVIDIA cuFFTMp 文档

欢迎使用 cuFFTMp (cuFFT 多进程) 库。

您可以在这里找到

cuFFTMp 作为 NVIDIA HPC-SDK 的一部分发布。

亮点

  • 2D 和 3D 分布式内存 FFT

  • Slab (1D) 和 Pencil (2D) 数据分解,具有任意块大小

  • 兼容 MPI 的接口

  • 使用 NVSHMEM 的低延迟实现,针对单节点和多节点 FFT 进行了优化

  • x86_64aarch64 支持 (参见 硬件和软件需求)