1. 概述
2. 设计考虑
3. 如何执行特定任务
4. 参考
5. 通知
GPUDirect RDMA
»
目录
v12.8 |
PDF
|
存档
目录
1. 概述
1.1. GPUDirect RDMA 工作原理
1.2. 标准 DMA 传输
1.3. GPUDirect RDMA 传输
1.4. CUDA 6.0 中的变更
1.5. CUDA 7.0 中的变更
1.6. CUDA 8.0 中的变更
1.7. CUDA 10.1 中的变更
1.8. CUDA 11.2 中的变更
1.9. CUDA 11.4 中的变更
1.10. CUDA 12.2 中的变更
2. 设计考虑
2.1. 延迟取消固定优化
2.2. 注册缓存
2.3. 取消固定回调
2.4. 支持的系统
2.5. PCI BAR 大小
2.6. 令牌使用
2.7. 同步和内存排序
3. 如何执行特定任务
3.1. 显示 GPU BAR 空间
3.2. 固定 GPU 内存
3.3. 取消固定 GPU 内存
3.4. 处理释放回调
3.5. 注册缓存的缓冲区 ID 标签检查
3.6. 将内核模块链接到 nvidia.ko
3.7. 使用 nvidia-peermem
4. 参考
4.1. UVA CUDA 内存管理基础
4.2. 用户空间 API
4.3. 内核 API
4.4. 移植到 Tegra
4.4.1. 更改分配器
4.4.2. 内核 API 的修改
4.4.3. 其他亮点
5. 通知
5.1. 声明
5.2. OpenCL
5.3. 商标