发行说明#

cuSOLVERMp v0.6.0#

  • 新增对 NVIDIA Blackwell GPU 架构的支持。

  • 不再支持 CUDA 11.x。

cuSOLVERMp v0.5.1#

  • 修复了 cusolverMpSyevd() 中的一个错误,当问题适合单个进程时,特征值未广播到所有进程。

已知问题#

cuSOLVERMp v0.5.0#

  • 提升了 cusolverMpStedc() 的性能。

  • 引入了一个新选项,通过设置 CUSOLVERMP_FORCE_NCCL=1 环境变量标志来强制使用 NCCL。目前仅适用于特征值求解器的部分。

cuSOLVERMp v0.4.3#

  • 支持 CUDA 12.1.1。

  • 修复了当问题很小且适合单个处理器时,处理器挂起的错误。

已知问题#

  • CUDA 12.1.1 兼容 NCCL v2.16.x 及更低版本;更高版本的 NCCL 在某些处理器网格上可能会间歇性挂起。

cuSOLVERMp v0.4.2#

  • 修复了 cusolverMpSyevd() 中的一个错误,即对于填充零条目的矩阵,代码返回内部错误;正确的行为是返回零特征值和单位特征向量。

  • 支持 CUDA 12.1.1

  • 请注意,该代码与 NCCL v2.16.x 及更低版本兼容

cuSOLVERMp v0.4.1#

  • 在 SYEVD 中增加了对行主序网格的支持。

cuSOLVERMp v0.4.0#

  • 随 HPC-SDK 23.5 发布。

  • 为对称(埃尔米特)广义特征值求解器添加了例程

    • cusolverMpSygst() 将对称(埃尔米特)广义特征值问题简化为标准形式。

    • cusolverMpSygvd() 计算对称(埃尔米特)广义特征值问题的所有特征值和特征向量。

cuSOLVERMp v0.3.1#

cuSOLVERMp v0.3.0#

cuSOLVERMp v0.2.0#

cuSOLVERMp v0.1.0#