发行说明#

本节包括重大更改、新功能、性能改进和各种问题。

NVPL BLAS 0.4.0#

新功能#

  • 改进了 Arm Neoverse V2 上小型 SGEMM 的性能

  • 改进了 Arm Neoverse V2 上中小问题规模的多线程性能

  • 改进了 incxincy 不等于 1 的 GEMV 的性能

已知问题#

  • 不适用

已解决问题#

  • 不适用

NVPL BLAS 0.3.0#

新功能#

  • 不适用

已知问题#

  • 不适用

已解决问题#

  • 不适用

NVPL BLAS 0.2.0#

新功能#

  • 改进了使用小型矩阵时在 Arm Neoverse V2 上 DGEMM 的性能

已知问题#

  • 不适用

已解决问题#

  • 运行 NVPL BLAS 早期版本时 Valgrind 崩溃

NVPL BLAS 0.1.0#

NVPL BLAS 库的首次早期访问版本发布

新功能#

  • 标准 C 和 Fortran BLAS API

  • Fortran 77 接口

  • 支持 lp64ilp64 接口

  • 支持单线程和多线程(基于 OpenMP)计算。

  • 扩展 API 包括: - 批量 GEMM API 扩展:分组批量和跨步批量 API - NVPL BLAS 服务函数:版本和线程控制

已知问题#

  • 不适用

已解决问题#

  • 不适用