NVSHMEM
3.2.5
  • 简介
    • 主要特性
    • 通信传输
    • NVSHMEM 的优势
    • GPU 发起的通信和强扩展性
  • 使用 NVSHMEM
    • NVSHMEM 示例程序
    • 使用 NVSHMEM InfiniBand GPUDirect Async 传输
    • 将 NVSHMEM 与 MPI 或 OpenSHMEM 结合使用
    • 编译 NVSHMEM 程序
    • 运行 NVSHMEM 程序
    • 通信模型
    • 数据一致性
    • 多进程 GPU 支持
    • 构建 NVSHMEM 应用程序/库
  • NVSHMEM 和 CUDA 模型
    • CUDA 执行模型
      • CUDA 中的工作提交
      • CUDA 抽象机
    • 非本地操作和 CUDA 执行模型
      • CUDA 流和循环依赖
      • CUDA 流顺序和执行资源
      • CUDA 流和虚假循环依赖
      • 内核内同步
      • 使用 NVSHMEM 协同内核启动确保安全的非本地操作
    • 隐式异步 cudaMemcpy
  • 内存模型
    • 指向对称对象的指针
    • 操作顺序
    • 原子性保证
    • NVSHMEM 和 OpenSHMEM 之间的差异
      • 阻塞式获取操作的顺序
      • 可见性保证
  • 执行模型
    • NVSHMEM 操作的进度
    • 调用 NVSHMEM 操作
  • 库常量
  • 库句柄
  • 环境变量
    • 标准选项
    • 引导选项
    • 附加选项
    • 集合通信选项
    • 传输选项
    • NVTX 选项
  • NVSHMEM API
    • API 概述
      • 不支持的 OpenSHMEM 1.3 API
      • 远程网络传输不支持的 OpenSHMEM 1.3 API
      • 支持的 OpenSHMEM API (OpenSHMEM 1.4 和 1.5)
      • CPU 线程的 NVSHMEM API 扩展
      • GPU 线程的 NVSHMEM API 扩展
    • 库设置、退出和查询
      • NVSHMEM_INIT
      • NVSHMEMX_INIT_ATTR
      • NVSHMEMX_HOSTLIB_INIT_ATTR
      • NVSHMEMX_HOSTLIB_FINALIZE
      • NVSHMEMX_GET_UNIQUE_ID
      • NVSHMEMX_SET_ATTR_UNIQUEID_ARGS
      • NVSHMEMX_CUMODULE_INIT
      • NVSHMEMX_INIT_STATUS
      • NVSHMEM_MY_PE
      • NVSHMEM_N_PES
      • NVSHMEM_FINALIZE
      • NVSHMEM_GLOBAL_EXIT
      • NVSHMEM_PTR
      • NVSHMEMX_MC_PTR
      • NVSHMEM_INFO_GET_VERSION
      • NVSHMEM_INFO_GET_NAME
      • NVSHMEMX_VENDOR_GET_VERSION_INFO
    • 线程支持
      • NVSHMEM_INIT_THREAD
      • NVSHMEM_QUERY_THREAD
    • 内核启动例程
      • NVSHMEMX_COLLECTIVE_LAUNCH
      • NVSHMEMX_COLLECTIVE_LAUNCH_QUERY_GRIDSIZE
    • 内存管理
      • NVSHMEM_MALLOC, NVSHMEM_FREE, NVSHMEM_ALIGN
      • NVSHMEM_CALLOC
      • 内存注册
        • NVSHMEMX_BUFFER_REGISTER
        • NVSHMEMX_BUFFER_UNREGISTER
        • NVSHMEMX_BUFFER_UNREGISTER_ALL
    • 团队管理
      • 预定义和应用程序定义的团队
      • 团队句柄
      • 线程安全
      • 集合通信排序
      • 团队创建
      • NVSHMEM_TEAM_MY_PE
      • NVSHMEM_TEAM_N_PES
      • NVSHMEM_TEAM_CONFIG_T
      • NVSHMEM_TEAM_GET_CONFIG
      • NVSHMEM_TEAM_TRANSLATE_PE
      • NVSHMEM_TEAM_SPLIT_STRIDED
      • NVSHMEM_TEAM_SPLIT_2D
      • NVSHMEM_TEAM_DESTROY
    • 远程内存访问
      • 阻塞式 RMA
        • NVSHMEM_PUT
        • NVSHMEM_P
        • NVSHMEM_IPUT
        • NVSHMEM_GET
        • NVSHMEM_G
        • NVSHMEM_IGET
      • 非阻塞式 RMA
        • NVSHMEM_PUT_NBI
        • NVSHMEM_GET_NBI
    • 原子内存操作
      • NVSHMEM_ATOMIC_FETCH
      • NVSHMEM_ATOMIC_SET
      • NVSHMEM_ATOMIC_COMPARE_SWAP
      • NVSHMEM_ATOMIC_SWAP
      • NVSHMEM_ATOMIC_FETCH_INC
      • NVSHMEM_ATOMIC_INC
      • NVSHMEM_ATOMIC_FETCH_ADD
      • NVSHMEM_ATOMIC_ADD
      • NVSHMEM_ATOMIC_FETCH_AND
      • NVSHMEM_ATOMIC_AND
      • NVSHMEM_ATOMIC_FETCH_OR
      • NVSHMEM_ATOMIC_OR
      • NVSHMEM_ATOMIC_FETCH_XOR
      • NVSHMEM_ATOMIC_XOR
    • 信号操作
      • 信号操作的原子性保证
      • 可用的信号运算符
      • NVSHMEM_PUT_SIGNAL
      • NVSHMEM_PUT_SIGNAL_NBI
      • NVSHMEM_SIGNAL_FETCH
      • NVSHMEMX_SIGNAL
      • NVSHMEMX_SIGNAL_OP
    • 集合通信
      • 基于团队的集合通信
      • 隐式团队集合通信
      • 从基于团队的集合通信返回的错误代码
      • NVSHMEM_BARRIER_ALL
      • NVSHMEM_BARRIER
      • NVSHMEM_SYNC
      • NVSHMEM_SYNC_ALL
      • NVSHMEM_ALLTOALL
      • NVSHMEM_BROADCAST
      • NVSHMEM_FCOLLECT
      • NVSHMEM_REDUCTIONS
        • AND
        • OR
        • XOR
        • MAX
        • MIN
        • SUM
        • PROD
    • 点对点同步
      • NVSHMEM_WAIT_UNTIL
      • NVSHMEM_WAIT_UNTIL_ALL
      • NVSHMEM_WAIT_UNTIL_ANY
      • NVSHMEM_WAIT_UNTIL_SOME
      • NVSHMEM_WAIT_UNTIL_ALL_VECTOR
      • NVSHMEM_WAIT_UNTIL_ANY_VECTOR
      • NVSHMEM_WAIT_UNTIL_SOME_VECTOR
      • NVSHMEM_TEST
      • NVSHMEM_TEST_ALL
      • NVSHMEM_TEST_ANY
      • NVSHMEM_TEST_SOME
      • NVSHMEM_TEST_ALL_VECTOR
      • NVSHMEM_TEST_ANY_VECTOR
      • NVSHMEM_TEST_SOME_VECTOR
      • NVSHMEM_SIGNAL_WAIT_UNTIL
    • 内存排序
      • NVSHMEM_FENCE
      • NVSHMEM_QUIET
  • 示例
    • 基于属性的初始化示例
    • 集合启动示例
    • 流上示例
    • 线程组示例
    • 块放置示例
    • 环形广播示例
    • 环形规约示例
  • 故障排除和常见问题解答
    • 一般常见问题解答
    • 先决条件常见问题解答
    • 运行 NVSHMEM 程序常见问题解答
    • 与 MPI 互操作性常见问题解答
    • 与 OpenSHMEM 互操作性常见问题解答
    • GPU-GPU 互连常见问题解答
    • NVSHMEM API 使用常见问题解答
    • 调试常见问题解答
    • 其他常见问题解答
  • NVSHMEM SLA
    • NVIDIA 软件开发工具包许可协议
      • 1. 许可。
      • 2. 限制。
      • 3. 所有权。
      • 4. 无担保。
      • 5. 责任限制。
      • 6. 终止。
      • 7. 通用条款。
    • NVSHMEM NVIDIA 软件开发工具包软件许可协议的补充条款
  • 致谢
    • 声明
    • 商标
    • 版权
NVSHMEM
  • 文档 »
  • 搜索


© Copyright 2022-2025, NVIDIA Corporation. 保留所有权利。

使用 Sphinx 构建,主题由 theme 提供,Read the Docs 提供支持。

隐私政策 | 管理我的隐私 | 请勿出售或分享我的数据 | 服务条款 |

辅助功能 | 公司政策 | 产品安全 | 联系我们

© . All rights reserved.