1. CUDA for Tegra
2. 概述
3. 内存管理
4. 移植注意事项
5. EGL 互操作性
6. Jetson 的 CUDA 可升级包
7. cuDLA
8. 通知
CUDA for Tegra
»
目录
v12.8 |
PDF
|
归档
目录
1. CUDA for Tegra
2. 概述
3. 内存管理
3.1. I/O 一致性
3.2. 估算集成 GPU 设备上的总可分配设备内存
4. 移植注意事项
4.1. 内存选择
4.2. 锁页内存
4.3. 在 Tegra 上有效使用统一内存
4.4. GPU 选择
4.5. 同步机制选择
4.6. Tegra 上不支持的 CUDA 功能
5. EGL 互操作性
5.1. EGLStream
5.1.1. EGLStream 流
5.1.2. CUDA 作为生产者
5.1.3. CUDA 作为消费者
5.1.4. 隐式同步
5.1.5. 生产者和消费者之间的数据传输
5.1.6. EGLStream 管道
5.2. EGLImage
5.2.1. CUDA 与 EGLImage 的互操作
5.3. EGLSync
5.3.1. CUDA 与 EGLSync 的互操作
5.3.2. 从 CUDA 事件创建 EGLSync
5.3.3. 从 EGLSync 创建 CUDA 事件
6. Jetson 的 CUDA 可升级包
6.1. 安装 CUDA 升级包
6.1.1. 前提条件
6.1.2. 从网络存储库或本地安装程序
6.2. CUDA 升级包的部署注意事项
6.2.1. 使用正确的升级包
6.2.2. 功能例外
6.2.3. 检查兼容性支持
7. cuDLA
7.1. 开发者指南
7.1.1. 设备模型
7.1.2. 加载和查询模块
7.1.3. 内存模型
7.1.4. 任务执行和同步模型
7.1.4.1. 任务执行
7.1.4.1.1. 多线程用户提交
7.1.4.2. 同步
7.1.4.2.1. 注册外部信号量
7.1.4.2.2. 为 cudlaSubmitTask() 设置事件
7.1.4.2.3. 等待信号事件
7.1.4.2.4. cuDLA 中支持的同步原语
7.1.4.2.5. 在 NvSciSyncAttrList 中设置 NvSciSyncAttrKey_RequireDeterministicFences 键
7.1.4.2.6. NvSciFence 的时间戳支持
7.1.4.2.7. 请求 NvSciSync 对象的时间戳支持
7.1.4.2.8. 从 Fence 中提取时间戳值
7.1.4.3. 故障诊断
7.1.4.4. NOOP 提交
7.1.5. 错误报告模型
7.2. 从 NvMediaDla 迁移到 cuDLA
7.3. 分析 cuDLA 应用
7.4. cuDLA 发行说明
8. 通知
8.1. 注意事项
8.2. OpenCL
8.3. 商标