发行说明#
本节包括重大更改、新功能、性能改进和各种问题。
NVPL BLAS 0.4.0#
新功能#
改进了 Arm Neoverse V2 上小型 SGEMM 的性能
改进了 Arm Neoverse V2 上中小问题规模的多线程性能
改进了
incx
和incy
不等于 1 的 GEMV 的性能
已知问题#
不适用
已解决问题#
不适用
NVPL BLAS 0.3.0#
新功能#
不适用
已知问题#
不适用
已解决问题#
不适用
NVPL BLAS 0.2.0#
新功能#
改进了使用小型矩阵时在 Arm Neoverse V2 上 DGEMM 的性能
已知问题#
不适用
已解决问题#
运行 NVPL BLAS 早期版本时 Valgrind 崩溃
NVPL BLAS 0.1.0#
NVPL BLAS 库的首次早期访问版本发布
新功能#
标准 C 和 Fortran BLAS API
Fortran 77 接口
支持
lp64
和ilp64
接口支持单线程和多线程(基于 OpenMP)计算。
扩展 API 包括: - 批量 GEMM API 扩展:分组批量和跨步批量 API - NVPL BLAS 服务函数:版本和线程控制
已知问题#
不适用
已解决问题#
不适用