NVPL TENSOR:开发者指南和参考#

欢迎使用 NVPL TENSOR 库文档。

NVPL TENSOR (NVIDIA Performance Libraries TENSOR) 是 NVIDIA Performance Libraries 的一部分,提供张量原语。

NVPL TENSOR 适用于任何具有 Armv8.1-A 或更高版本架构扩展的 64 位 Arm 架构处理器,并针对以下处理器进行了专门优化

  • 基于 Arm Neoverse V2 的 CPU,例如 NVIDIA Grace

  • 基于 Arm Neoverse V1 的 CPU,例如 Amazon (AWS) Graviton3

主要特性#

该文档由三个主要部分组成

  • 用户指南,介绍了 cuTENSOR 的重要基础知识,包括关于符号和准确性的详细信息。

  • 入门指南,其中逐步介绍了简单的张量缩并示例。

  • API 参考,其中全面概述了所有库例程、常量和数据类型。

目录#

索引和表格#