Logo
  • 1. 概述
  • 2. 设计考虑
  • 3. 如何执行特定任务
  • 4. 参考
  • 5. 通知
GPUDirect RDMA
  • »
  • 目录
  • v12.8 | PDF | 存档  

目录

  • 1. 概述
    • 1.1. GPUDirect RDMA 工作原理
    • 1.2. 标准 DMA 传输
    • 1.3. GPUDirect RDMA 传输
    • 1.4. CUDA 6.0 中的变更
    • 1.5. CUDA 7.0 中的变更
    • 1.6. CUDA 8.0 中的变更
    • 1.7. CUDA 10.1 中的变更
    • 1.8. CUDA 11.2 中的变更
    • 1.9. CUDA 11.4 中的变更
    • 1.10. CUDA 12.2 中的变更
  • 2. 设计考虑
    • 2.1. 延迟取消固定优化
    • 2.2. 注册缓存
    • 2.3. 取消固定回调
    • 2.4. 支持的系统
    • 2.5. PCI BAR 大小
    • 2.6. 令牌使用
    • 2.7. 同步和内存排序
  • 3. 如何执行特定任务
    • 3.1. 显示 GPU BAR 空间
    • 3.2. 固定 GPU 内存
    • 3.3. 取消固定 GPU 内存
    • 3.4. 处理释放回调
    • 3.5. 注册缓存的缓冲区 ID 标签检查
    • 3.6. 将内核模块链接到 nvidia.ko
    • 3.7. 使用 nvidia-peermem
  • 4. 参考
    • 4.1. UVA CUDA 内存管理基础
    • 4.2. 用户空间 API
    • 4.3. 内核 API
    • 4.4. 移植到 Tegra
      • 4.4.1. 更改分配器
      • 4.4.2. 内核 API 的修改
      • 4.4.3. 其他亮点
  • 5. 通知
    • 5.1. 声明
    • 5.2. OpenCL
    • 5.3. 商标

隐私政策 | 管理我的隐私 | 请勿出售或分享我的数据 | 服务条款 | 无障碍功能 | 公司政策 | 产品安全 | 联系方式

版权所有 © 2012-2025,NVIDIA Corporation 及附属公司。保留所有权利。

最后更新于 2025 年 1 月 21 日。

© . All rights reserved.