NVPL TENSOR:开发者指南和参考#
欢迎使用 NVPL TENSOR 库文档。
NVPL TENSOR (NVIDIA Performance Libraries TENSOR) 是 NVIDIA Performance Libraries 的一部分,提供张量原语。
NVPL TENSOR 适用于任何具有 Armv8.1-A 或更高版本架构扩展的 64 位 Arm 架构处理器,并针对以下处理器进行了专门优化
基于 Arm Neoverse V2 的 CPU,例如 NVIDIA Grace
基于 Arm Neoverse V1 的 CPU,例如 Amazon (AWS) Graviton3
主要特性#
支持高达 64 维的张量。
任意数据布局。
主要计算例程
张量缩并.
任意张量置换。
该文档由三个主要部分组成