cuTENSOR:用于张量原语的高性能 CUDA 库

欢迎使用 cuTENSOR 库文档。

cuTENSOR 是一个用于张量原语的高性能 CUDA 库。

下载: https://developer.nvidia.com/cutensor/downloads

主要特性

  • 广泛的混合精度支持

    • FP64 输入与 FP32 计算。

    • FP32 输入与 FP16、BF16、TF32 或 3XTF32 计算。

    • 复数乘以实数运算。

    • 共轭(无转置)支持。

  • 即时 (JIT) 编译

  • 支持高达 64 维的张量。

  • 任意数据布局。

  • 主要计算例程

该文档由三个主要组件组成

  • 一个 用户指南,介绍了 cuTENSOR 的重要基础知识,包括关于符号和精度的详细信息。

  • 一个 入门指南,逐步介绍了一个简单的张量缩并示例。

  • 一个 API 参考,全面概述了所有库例程、常量和数据类型。

支持

操作系统

CPU 架构

RHEL 8, openSUSE 15, SLES 15, Ubuntu 24.04/22.04/20.04

x86_64, SBSA

Windows 10

x86_64

  • 支持的 CUDA 工具包: 11.0, 11.8, 12.x

  • 支持的 SM 架构 : SM 6.0, SM 7.0, SM7.5, SM 8.0, SM 8.9, SM 9.0

  • 已弃用的操作系统 :

先决条件

  • 依赖项 : cudart, cutensor.h 头文件

目录

索引和表格