1. 简介
2. 入门指南
3. 用户界面
4. 语言
5. 基本用法
6. 预编译头文件 (CUDA 12.8+)
7. 访问降级名称
8. 与模板主机代码交互
9. 版本控制方案
10. 其他注意事项
11. 示例:SAXPY
12. 示例:使用降级名称
13. 示例:使用 nvrtcGetTypeName
14. 示例:动态并行
15. 示例:设备 LTO(链接时优化)
16. 示例:自动 PCH (CUDA 12.8+)
17. 示例:显式 PCH 创建/使用 (CUDA 12.8+)
18. 示例:PCH 堆调整大小 (CUDA 12.8+)
NVRTC
»
目录
v12.8 |
PDF
|
存档
目录
1. 简介
2. 入门指南
2.1. 系统要求
2.2. 安装
3. 用户界面
3.1. 错误处理
3.1.1. 枚举
3.1.2. 函数
3.2. 常规信息查询
3.2.1. 函数
3.3. 编译
3.3.1. 函数
3.3.2. 类型定义
3.4. 支持的编译选项
3.5. 预编译头文件 (PCH) (CUDA 12.8+)
3.5.1. 函数
3.6. 主机助手
3.6.1. 函数
4. 语言
4.1. 执行空间
4.2. 分离编译
4.3. 动态并行
4.4. 整数大小
4.5. 包含语法
4.6. 预定义宏
4.7. 预定义类型
4.8. 内置函数
4.9. 默认 C++ 方言
5. 基本用法
6. 预编译头文件 (CUDA 12.8+)
6.1. 概述
6.2. 实现概述
6.3. 自动 PCH
6.4. 显式 PCH 创建和使用
6.5. 确定
头文件停止
点
6.6. PCH 失败条件
6.7. PCH 堆控制
6.8. 其他控制
6.8.1. 环境变量
6.8.2. 编译指示
6.8.3. 标志
6.8.4. 在创建 PCH 之前进行模板实例化
7. 访问降级名称
7.1. 示例
7.2. 注释
8. 与模板主机代码交互
8.1. 模板主机代码示例
9. 版本控制方案
9.1. NVRTC 共享库版本控制
9.2. NVRTC-builtins 库
10. 其他注意事项
10.1. 线程安全
10.2. 堆栈大小
10.3. NVRTC 静态库
11. 示例:SAXPY
11.1. 代码 (saxpy.cpp)
11.2. Saxpy 构建说明
12. 示例:使用降级名称
12.1. 代码 (lowered-name.cpp)
12.2. 降级名称构建说明
13. 示例:使用 nvrtcGetTypeName
13.1. 代码 (host-type-name.cpp)
13.2. nvrtcGetTypeName 构建说明
14. 示例:动态并行
14.1. 动态并行构建说明
15. 示例:设备 LTO(链接时优化)
15.1. 代码 (offline.cu)
15.2. 代码 (online.cpp)
15.3. 设备 LTO 构建说明
16. 示例:自动 PCH (CUDA 12.8+)
16.1. 代码 (auto_pch_common.h)
16.2. 代码 (auto_pch.cpp)
16.3. 自动 PCH 构建说明
17. 示例:显式 PCH 创建/使用 (CUDA 12.8+)
17.1. 代码 (common.h)
17.2. 代码 (explicit_pch.cpp)
17.3. 显式 PCH 构建说明
18. 示例:PCH 堆调整大小 (CUDA 12.8+)
18.1. 代码 (auto_pch_common.h)
18.2. 代码 (pch_resize.cpp)
18.3. PCH 堆调整大小构建说明
18.4. 通知
18.4.1. 通知
18.4.2. OpenCL
18.4.3. 商标