NVIDIA cuDNN 后端# 如果您只想使用非基于图接口且未通过前端 API 层公开的传统固定功能例程,请仅使用NVIDIA cuDNN 后端 API。 NVIDIA cuDNN 前端 API提供了一个简化的编程模型,该模型足以满足大多数用例。 概述 安装指南 发行说明 cuDNN 9.7.1 cuDNN 9.7.0 cuDNN 9.6.0 cuDNN 9.5.1 cuDNN 9.5.0 cuDNN 9.4.0 cuDNN 9.3.0 cuDNN 9.2.1 cuDNN 9.2.0 cuDNN 9.1.1 cuDNN 9.1.0 cuDNN 9.0.0 后端 API 后端 API 概述 cudnn_graph 库 cudnn_ops 库 cudnn_cnn 库 cudnn_adv 库 后端开发者指南 概述 核心概念 cuDNN 句柄 Tensor Core 运算 关于 Tensor Core 精度的说明 Graph API 后端原生 CUDA Graph API Legacy API 卷积函数 先决条件 支持的算法 数据和过滤器格式 RNN 函数 先决条件 支持的算法 数据和过滤器格式 RNN 函数的特性 张量变换 FP32 和 FP16 之间的转换 填充 折叠 NCHW 和 NHWC 之间的转换 混合精度数值准确性 兼容性 cuDNN API 兼容性 向前兼容性和传统 API 杂项 可重复性(确定性) 缩放参数 弃用政策 GPU 和驱动程序要求 卷积的约定和特性 卷积公式 分组卷积 3D 卷积的最佳实践 推荐设置 局限性 环境变量 针对 CUDNN_VERSION 的版本检查 cuDNN 符号服务器 示例:符号化 初始化和终止期间的 API 用法 参考 支持矩阵 GPU、CUDA 工具包和 CUDA 驱动程序要求 CPU 架构和操作系统要求 Linux Windows 故障排除 错误报告和 API 日志记录 文档存档 软件许可协议 NVIDIA 软件开发工具包许可协议 许可。 授权 分发要求 授权用户 预发布 SDK 更新 其他许可下的组件 权利保留 限制。 所有权。 无担保。 责任限制。 终止。 通用条款。 cuDNN NVIDIA 软件开发工具包许可协议补充条款 致谢 田纳西大学 加州大学伯克利分校 纽约 Facebook AI 研究院 机构及其贡献 声明