7.9. cudaDeviceProp 结构体参考
[CUDA 运行时使用的数据类型]
CUDA 设备属性
公共变量
- int ECCEnabled
- int accessPolicyMaxWindowSize
- int asyncEngineCount
- int canMapHostMemory
- int canUseHostPointerForRegisteredMem
- int clockRate
- int clusterLaunch
- int computeMode
- int computePreemptionSupported
- int concurrentKernels
- int concurrentManagedAccess
- int cooperativeLaunch
- int cooperativeMultiDeviceLaunch
- int deferredMappingCudaArraySupported
- int deviceOverlap
- int directManagedMemAccessFromHost
- int globalL1CacheSupported
- unsigned int gpuDirectRDMAFlushWritesOptions
- int gpuDirectRDMASupported
- int gpuDirectRDMAWritesOrdering
- int hostNativeAtomicSupported
- int hostRegisterReadOnlySupported
- int hostRegisterSupported
- int integrated
- int ipcEventSupported
- int isMultiGpuBoard
- int kernelExecTimeoutEnabled
- int l2CacheSize
- int localL1CacheSupported
- char luid[8]
- unsigned int luidDeviceNodeMask
- int major
- int managedMemory
- int maxBlocksPerMultiProcessor
- int maxGridSize[3]
- int maxSurface1D
- int maxSurface1DLayered[2]
- int maxSurface2D[2]
- int maxSurface2DLayered[3]
- int maxSurface3D[3]
- int maxSurfaceCubemap
- int maxSurfaceCubemapLayered[2]
- int maxTexture1D
- int maxTexture1DLayered[2]
- int maxTexture1DLinear
- int maxTexture1DMipmap
- int maxTexture2D[2]
- int maxTexture2DGather[2]
- int maxTexture2DLayered[3]
- int maxTexture2DLinear[3]
- int maxTexture2DMipmap[2]
- int maxTexture3D[3]
- int maxTexture3DAlt[3]
- int maxTextureCubemap
- int maxTextureCubemapLayered[2]
- int maxThreadsDim[3]
- int maxThreadsPerBlock
- int maxThreadsPerMultiProcessor
- size_t memPitch
- int memoryBusWidth
- int memoryClockRate
- unsigned int memoryPoolSupportedHandleTypes
- int memoryPoolsSupported
- int minor
- int multiGpuBoardGroupID
- int multiProcessorCount
- char name[256]
- int pageableMemoryAccess
- int pageableMemoryAccessUsesHostPageTables
- int pciBusID
- int pciDeviceID
- int pciDomainID
- int persistingL2CacheMaxSize
- int regsPerBlock
- int regsPerMultiprocessor
- int reserved[63]
- size_t reservedSharedMemPerBlock
- size_t sharedMemPerBlock
- size_t sharedMemPerBlockOptin
- size_t sharedMemPerMultiprocessor
- int singleToDoublePrecisionPerfRatio
- int sparseCudaArraySupported
- int streamPrioritiesSupported
- size_t surfaceAlignment
- int tccDriver
- size_t textureAlignment
- size_t texturePitchAlignment
- int timelineSemaphoreInteropSupported
- size_t totalConstMem
- size_t totalGlobalMem
- int unifiedAddressing
- int unifiedFunctionPointers
- cudaUUID_t uuid
- int warpSize
变量
- int cudaDeviceProp::ECCEnabled [继承]
-
设备已启用 ECC 支持
- int cudaDeviceProp::accessPolicyMaxWindowSize [继承]
- int cudaDeviceProp::asyncEngineCount [继承]
-
异步引擎的数量
- int cudaDeviceProp::canMapHostMemory [继承]
-
设备可以使用 cudaHostAlloc/cudaHostGetDevicePointer 映射主机内存
- int cudaDeviceProp::canUseHostPointerForRegisteredMem [继承]
-
设备可以像 CPU 一样在相同的虚拟地址访问主机注册内存
- int cudaDeviceProp::clockRate [继承]
-
已弃用,时钟频率,单位为千赫兹
- int cudaDeviceProp::clusterLaunch [继承]
-
指示设备支持集群启动
- int cudaDeviceProp::computeMode [继承]
-
已弃用,计算模式(参见 cudaComputeMode)
- int cudaDeviceProp::computePreemptionSupported [继承]
-
设备支持计算抢占
- int cudaDeviceProp::concurrentKernels [继承]
-
设备可能可以并发执行多个内核
- int cudaDeviceProp::concurrentManagedAccess [继承]
-
设备可以与 CPU 并发地连贯访问托管内存
- int cudaDeviceProp::cooperativeLaunch [继承]
-
设备支持通过 cudaLaunchCooperativeKernel 启动协同内核
- int cudaDeviceProp::cooperativeMultiDeviceLaunch [继承]
-
已弃用,cudaLaunchCooperativeKernelMultiDevice 已弃用。
- int cudaDeviceProp::deferredMappingCudaArraySupported [继承]
-
如果设备支持延迟映射 CUDA 数组和 CUDA mipmapped 数组,则为 1
- int cudaDeviceProp::deviceOverlap [继承]
-
设备可以并发地复制内存并执行内核。已弃用。请改用 asyncEngineCount。
- int cudaDeviceProp::directManagedMemAccessFromHost [继承]
-
主机可以直接访问设备上的托管内存,而无需迁移。
- int cudaDeviceProp::globalL1CacheSupported [继承]
-
设备支持在 L1 中缓存全局变量
- unsigned int cudaDeviceProp::gpuDirectRDMAFlushWritesOptions [继承]
-
要根据 cudaFlushGPUDirectRDMAWritesOptions 枚举解释的位掩码
- int cudaDeviceProp::gpuDirectRDMASupported [继承]
-
如果设备支持 GPUDirect RDMA API,则为 1,否则为 0
- int cudaDeviceProp::gpuDirectRDMAWritesOrdering [继承]
-
有关数值,请参见 cudaGPUDirectRDMAWritesOrdering 枚举
- int cudaDeviceProp::hostNativeAtomicSupported [继承]
-
设备和主机之间的链接支持本机原子操作
- int cudaDeviceProp::hostRegisterReadOnlySupported [继承]
-
设备支持使用 cudaHostRegister 标志 cudaHostRegisterReadOnly 来注册必须作为只读映射到 GPU 的内存
- int cudaDeviceProp::hostRegisterSupported [继承]
-
设备支持通过 cudaHostRegister 进行主机内存注册。
- int cudaDeviceProp::integrated [继承]
-
设备是集成的,而不是离散的
- int cudaDeviceProp::ipcEventSupported [继承]
-
设备支持 IPC 事件。
- int cudaDeviceProp::isMultiGpuBoard [继承]
-
设备位于多 GPU 板上
- int cudaDeviceProp::kernelExecTimeoutEnabled [继承]
-
已弃用,指定内核运行时是否有限制
- int cudaDeviceProp::l2CacheSize [继承]
-
L2 缓存的大小,以字节为单位
- int cudaDeviceProp::localL1CacheSupported [继承]
-
设备支持在 L1 中缓存本地变量
- char cudaDeviceProp::luid[8] [继承]
-
8 字节本地唯一标识符。在 TCC 和非 Windows 平台上,该值未定义
- unsigned int cudaDeviceProp::luidDeviceNodeMask [继承]
-
LUID 设备节点掩码。在 TCC 和非 Windows 平台上,该值未定义
- int cudaDeviceProp::major [继承]
-
主要计算能力
- int cudaDeviceProp::managedMemory [继承]
-
设备支持在此系统上分配托管内存
- int cudaDeviceProp::maxBlocksPerMultiProcessor [继承]
-
每个多处理器允许的最大常驻块数
- int cudaDeviceProp::maxGridSize[3] [继承]
-
网格每个维度的最大大小
- int cudaDeviceProp::maxSurface1D [继承]
-
最大 1D 表面尺寸
- int cudaDeviceProp::maxSurface1DLayered[2] [继承]
-
最大 1D 分层表面尺寸
- int cudaDeviceProp::maxSurface2D[2] [继承]
-
最大 2D 表面尺寸
- int cudaDeviceProp::maxSurface2DLayered[3] [继承]
-
最大 2D 分层表面尺寸
- int cudaDeviceProp::maxSurface3D[3] [继承]
-
最大 3D 表面尺寸
- int cudaDeviceProp::maxSurfaceCubemap [继承]
-
最大 Cubemap 表面尺寸
- int cudaDeviceProp::maxSurfaceCubemapLayered[2] [继承]
-
最大 Cubemap 分层表面尺寸
- int cudaDeviceProp::maxTexture1D [继承]
-
最大 1D 纹理尺寸
- int cudaDeviceProp::maxTexture1DLayered[2] [继承]
-
最大 1D 分层纹理尺寸
- int cudaDeviceProp::maxTexture1DLinear [继承]
- int cudaDeviceProp::maxTexture1DMipmap [继承]
-
最大 1D mipmapped 纹理尺寸
- int cudaDeviceProp::maxTexture2D[2] [inherited]
-
最大 2D 纹理尺寸
- int cudaDeviceProp::maxTexture2DGather[2] [inherited]
-
如果需要执行纹理Gather操作,则为最大 2D 纹理尺寸
- int cudaDeviceProp::maxTexture2DLayered[3] [inherited]
-
最大 2D 分层纹理尺寸
- int cudaDeviceProp::maxTexture2DLinear[3] [inherited]
-
绑定到倾斜内存的 2D 纹理的最大尺寸(宽度、高度、间距)
- int cudaDeviceProp::maxTexture2DMipmap[2] [inherited]
-
最大 2D Mipmapped 纹理尺寸
- int cudaDeviceProp::maxTexture3D[3] [inherited]
-
最大 3D 纹理尺寸
- int cudaDeviceProp::maxTexture3DAlt[3] [inherited]
-
最大备选 3D 纹理尺寸
- int cudaDeviceProp::maxTextureCubemap [inherited]
-
最大 Cubemap 纹理尺寸
- int cudaDeviceProp::maxTextureCubemapLayered[2] [inherited]
-
最大 Cubemap 分层纹理尺寸
- int cudaDeviceProp::maxThreadsDim[3] [inherited]
-
一个块的每个维度的最大尺寸
- int cudaDeviceProp::maxThreadsPerBlock [inherited]
-
每个块的最大线程数
- int cudaDeviceProp::maxThreadsPerMultiProcessor [inherited]
-
每个多处理器最大常驻线程数
- size_t cudaDeviceProp::memPitch [inherited]
-
内存复制允许的最大间距(以字节为单位)
- int cudaDeviceProp::memoryBusWidth [inherited]
-
全局内存总线宽度(以位为单位)
- int cudaDeviceProp::memoryClockRate [inherited]
-
已弃用,峰值内存时钟频率(千赫兹)
- unsigned int cudaDeviceProp::memoryPoolSupportedHandleTypes [inherited]
-
基于 mempool 的 IPC 支持的句柄类型位掩码
- int cudaDeviceProp::memoryPoolsSupported [inherited]
-
如果设备支持使用 cudaMallocAsync 和 cudaMemPool 系列 API,则为 1,否则为 0
- int cudaDeviceProp::minor [inherited]
-
次要计算能力
- int cudaDeviceProp::multiGpuBoardGroupID [inherited]
-
同一多 GPU 板卡上的一组设备的唯一标识符
- int cudaDeviceProp::multiProcessorCount [inherited]
-
设备上的多处理器数量
- char cudaDeviceProp::name[256] [inherited]
-
标识设备的 ASCII 字符串
- int cudaDeviceProp::pageableMemoryAccess [inherited]
-
设备支持一致地访问可分页内存,而无需对其调用 cudaHostRegister
- int cudaDeviceProp::pageableMemoryAccessUsesHostPageTables [inherited]
-
设备通过主机的页表访问可分页内存
- int cudaDeviceProp::pciBusID [inherited]
-
设备的 PCI 总线 ID
- int cudaDeviceProp::pciDeviceID [inherited]
-
设备的 PCI 设备 ID
- int cudaDeviceProp::pciDomainID [inherited]
-
设备的 PCI 域 ID
- int cudaDeviceProp::persistingL2CacheMaxSize [inherited]
-
设备的最大 L2 持久化行容量设置(以字节为单位)
- int cudaDeviceProp::regsPerBlock [inherited]
-
每个块可用的 32 位寄存器
- int cudaDeviceProp::regsPerMultiprocessor [inherited]
-
每个多处理器可用的 32 位寄存器
- int cudaDeviceProp::reserved[63] [inherited]
-
保留供将来使用
- size_t cudaDeviceProp::reservedSharedMemPerBlock [inherited]
-
CUDA 驱动程序为每个块保留的共享内存(以字节为单位)
- size_t cudaDeviceProp::sharedMemPerBlock [inherited]
-
每个块可用的共享内存(以字节为单位)
- size_t cudaDeviceProp::sharedMemPerBlockOptin [inherited]
-
每个设备每个块可通过特殊选择加入使用的最大共享内存
- size_t cudaDeviceProp::sharedMemPerMultiprocessor [inherited]
-
每个多处理器可用的共享内存(以字节为单位)
- int cudaDeviceProp::singleToDoublePrecisionPerfRatio [inherited]
-
已弃用,单精度性能(以每秒浮点运算次数计)与双精度性能之比
- int cudaDeviceProp::sparseCudaArraySupported [inherited]
-
如果设备支持稀疏 CUDA 数组和稀疏 CUDA Mipmapped 数组,则为 1,否则为 0
- int cudaDeviceProp::streamPrioritiesSupported [inherited]
-
设备支持流优先级
- size_t cudaDeviceProp::surfaceAlignment [inherited]
-
表面的对齐要求
- int cudaDeviceProp::tccDriver [inherited]
-
如果设备是使用 TCC 驱动程序的 Tesla 设备,则为 1,否则为 0
- size_t cudaDeviceProp::textureAlignment [inherited]
-
纹理的对齐要求
- size_t cudaDeviceProp::texturePitchAlignment [inherited]
-
绑定到倾斜内存的纹理引用的间距对齐要求
- int cudaDeviceProp::timelineSemaphoreInteropSupported [inherited]
-
设备上支持外部时间线信号量互操作
- size_t cudaDeviceProp::totalConstMem [inherited]
-
设备上可用的常量内存(以字节为单位)
- size_t cudaDeviceProp::totalGlobalMem [inherited]
-
设备上可用的全局内存(以字节为单位)
- int cudaDeviceProp::unifiedAddressing [inherited]
-
设备与主机共享统一地址空间
- int cudaDeviceProp::unifiedFunctionPointers [inherited]
-
指示设备支持统一指针
- cudaUUID_t cudaDeviceProp::uuid [inherited]
-
16 字节唯一标识符
- int cudaDeviceProp::warpSize [inherited]
-
Warp 大小(以线程为单位)