cuTENSOR
2.1.0
  • 发行说明
    • cuTENSOR v2.1.0
    • cuTENSOR v2.0.2
    • cuTENSOR v2.0.0
    • cuTENSOR v1.7.0
    • cuTENSOR v1.6.2
    • cuTENSOR v1.6.1
    • cuTENSOR v1.6.0
    • cuTENSOR v1.5.0
    • cuTENSOR v1.4.0
    • cuTENSOR v1.3.3
    • cuTENSOR v1.3.2
    • cuTENSOR v1.3.1
    • cuTENSOR v1.3.0
    • cuTENSOR v1.2.2
    • cuTENSOR v1.2.1
    • cuTENSOR v1.2.0
    • cuTENSOR v1.1.0
    • cuTENSOR v1.0.1
    • cuTENSOR v1.0.0
  • 用户指南
    • 术语表
    • 爱因斯坦求和约定
    • 性能指南
    • 软件管理的计划缓存
    • 精度保证
    • 标量类型
    • 支持的 Unary 运算符
    • 支持的 GPU
    • CUDA Graph 支持
    • 日志记录
    • 环境变量
  • 入门指南
    • 安装与编译
    • 头文件和数据类型
    • 定义张量大小
    • 初始化张量数据
    • 创建张量描述符
    • 创建 Contraction 描述符
    • 确定算法和工作空间
    • 计划和减少工作空间
    • 执行
  • 迁移到 cuTENSOR 2.x
    • 概述
    • 一览差异
    • 示例 1:将 contraction 从 1.x 迁移到 2.x
    • 示例 2:将 reduction 操作从 1.x 迁移到 2.x
    • 示例 3:将 permutation/elementwise 操作从 1.x 迁移到 2.x
  • 即时 (JIT) 编译
    • 入门示例
    • 从磁盘读取和写入内核缓存
  • 计划缓存
    • 增量式自动调优
    • 入门示例
    • 高级示例
  • 多 GPU 支持 - cuTENSORMg
    • 性能指南
    • 精度保证
    • 标量类型
    • CUDA Graph 支持
    • cuTENSORMg 日志记录
  • API 参考
    • cuTENSOR 数据类型
      • cutensorDataType_t
      • cutensorComputeDescriptor_t
      • cutensorHandle_t
      • cutensorTensorDescriptor_t
      • cutensorOperationDescriptor_t
      • cutensorOperationDescriptorAttribute_t
      • cutensorPlanPreference_t
      • cutensorPlanPreferenceAttribute_t
      • cutensorPlan_t
      • cutensorPlanAttribute_t
      • cutensorAutotuneMode_t
      • cutensorJitMode_t
      • cutensorCacheMode_t
      • cutensorAlgo_t
      • cutensorWorksizePreference_t
      • cutensorOperator_t
      • cutensorStatus_t
      • cudaDataType_t
      • cutensorLoggerCallback_t
    • cuTENSOR 函数
      • 辅助函数
        • cutensorCreate()
        • cutensorDestroy()
        • cutensorCreateTensorDescriptor()
        • cutensorDestroyTensorDescriptor()
        • cutensorGetErrorString()
        • cutensorGetVersion()
        • cutensorGetCudartVersion()
      • 逐元素操作
        • cutensorCreateElementwiseTrinary()
        • cutensorElementwiseTrinaryExecute()
        • cutensorCreateElementwiseBinary()
        • cutensorElementwiseBinaryExecute()
        • cutensorCreatePermutation()
        • cutensorPermute()
      • Contraction 操作
        • cutensorCreateContraction()
        • cutensorContract()
      • Reduction 操作
        • cutensorCreateReduction()
        • cutensorReduce()
      • 通用操作函数
        • cutensorDestroyOperationDescriptor()
        • cutensorOperationDescriptorGetAttribute()
        • cutensorOperationDescriptorSetAttribute()
        • cutensorCreatePlanPreference()
        • cutensorDestroyPlanPreference()
        • cutensorPlanPreferenceSetAttribute()
        • cutensorEstimateWorkspaceSize()
        • cutensorCreatePlan()
        • cutensorDestroyPlan()
        • cutensorPlanGetAttribute()
        • cutensorPlanPreferenceSetAttribute()
      • 缓存相关操作
        • cutensorHandleResizePlanCache()
        • cutensorHandleReadPlanCacheFromFile()
        • cutensorHandleWritePlanCacheToFile()
        • cutensorReadKernelCacheFromFile()
        • cutensorWriteKernelCacheToFile()
      • 日志记录函数
        • cutensorLoggerSetCallback()
        • cutensorLoggerSetFile()
        • cutensorLoggerOpenFile()
        • cutensorLoggerSetLevel()
        • cutensorLoggerSetMask()
        • cutensorLoggerForceDisable()
  • API 参考 - cuTENSORMg
    • 通用
      • cutensorMgHostDevice_t
      • cutensorMgHandle_t
      • cutensorMgTensorDescriptor_t
      • cutensorMgCreate()
      • cutensorMgDestroy()
      • cutensorMgCreateTensorDescriptor()
      • cutensorMgDestroyTensorDescriptor()
    • 复制操作
      • cutensorMgCopyDescriptor_t
      • cutensorMgCopyPlan_t
      • cutensorMgCreateCopyDescriptor()
      • cutensorMgDestroyCopyDescriptor()
      • cutensorMgCopyGetWorkspace()
      • cutensorMgCreateCopyPlan()
      • cutensorMgDestroyCopyPlan()
      • cutensorMgCopy()
    • Contraction 操作
      • cutensorMgContractionDescriptor_t
      • cutensorMgContractionFind_t
      • cutensorMgContractionPlan_t
      • cutensorMgAlgo_t
      • cutensorMgCreateContractionDescriptor()
      • cutensorMgDestroyContractionDescriptor()
      • cutensorMgCreateContractionFind()
      • cutensorMgDestroyContractionFind()
      • cutensorMgContractionGetWorkspace()
      • cutensorMgCreateContractionPlan()
      • cutensorMgDestroyContractionPlan()
      • cutensorMgContraction()
  • 软件许可协议
  • 第三方许可协议
    • HPTT
cuTENSOR
  • 搜索


隐私政策 | 管理我的隐私 | 请勿出售或分享我的数据 | 服务条款 | 辅助功能 | 公司政策 | 产品安全 | 联系方式

版权所有 © 2019-2025,NVIDIA Corporation 及其附属公司。

NVIDIA cuTensor 版本: 2.1.0

© . All rights reserved.