NVSHMEM 最佳实践指南# NVSHMEM 最佳实践指南 NVSHMEM 初始化 两阶段初始化 设备 API 对等传输上的设备 API 基于代理的传输上的设备 API IBGDA 传输上的设备 API 流式 API 主机 API CUDA NVSHMEM 互操作性 使用 CUDA 流 API NVSHMEM 运行时配置 环境行为 NVSHMEM 不支持的操作 工具链 操作 NVSHMEM 性能 在应用程序中使用 16 字节对齐缓冲区 使用 nvshmem_*block 进行异构传输配置 调整 IBGDA 的队列对类型和配置