cuTENSOR:用于张量原语的高性能 CUDA 库¶
欢迎使用 cuTENSOR 库文档。
cuTENSOR 是一个用于张量原语的高性能 CUDA 库。
下载: https://developer.nvidia.com/cutensor/downloads
主要特性¶
广泛的混合精度支持
FP64 输入与 FP32 计算。
FP32 输入与 FP16、BF16、TF32 或 3XTF32 计算。
复数乘以实数运算。
共轭(无转置)支持。
即时 (JIT) 编译
支持高达 64 维的张量。
任意数据布局。
主要计算例程
支持各种激活函数。
任意张量置换。
不同数据类型之间的转换。
支持填充输出张量。
该文档由三个主要组件组成
支持¶
操作系统 |
CPU 架构 |
---|---|
|
|
|
|
|
先决条件¶
依赖项 :
cudart
,cutensor.h
头文件
目录¶
- 发行说明
- cuTENSOR v2.1.0
- cuTENSOR v2.0.2
- cuTENSOR v2.0.0
- cuTENSOR v1.7.0
- cuTENSOR v1.6.2
- cuTENSOR v1.6.1
- cuTENSOR v1.6.0
- cuTENSOR v1.5.0
- cuTENSOR v1.4.0
- cuTENSOR v1.3.3
- cuTENSOR v1.3.2
- cuTENSOR v1.3.1
- cuTENSOR v1.3.0
- cuTENSOR v1.2.2
- cuTENSOR v1.2.1
- cuTENSOR v1.2.0
- cuTENSOR v1.1.0
- cuTENSOR v1.0.1
- cuTENSOR v1.0.0
- 用户指南
- 入门指南
- 过渡到 cuTENSOR 2.x
- 即时 (JIT) 编译
- 计划缓存
- 多 GPU 支持 - cuTENSORMg
- API 参考
- API 参考 - cuTENSORMg
- 软件许可协议
- 第三方许可协议