6.16. CUpti_ActivityDevice5

struct CUpti_ActivityDevice5

设备的活动记录。

(CUDA 11.6 及更高版本)

此活动记录表示关于 GPU 设备的信息 (CUPTI_ACTIVITY_KIND_DEVICE)。

公共成员

CUpti_ActivityKind kind

活动记录类型,必须为 CUPTI_ACTIVITY_KIND_DEVICE。

CUpti_ActivityFlag flags

与设备关联的标志。

另请参阅

CUpti_ActivityFlag

uint64_t globalMemoryBandwidth

设备上可用的全局内存带宽,单位为 kBytes/秒。

uint64_t globalMemorySize

设备上的全局内存量,单位为字节。

uint32_t constantMemorySize

设备上的常量内存量,单位为字节。

uint32_t l2CacheSize

设备上 L2 缓存的大小,单位为字节。

uint32_t numThreadsPerWarp

设备上每个 Warp 的线程数。

uint32_t coreClockRate

设备的核心时钟速率,单位为 kHz。

uint32_t numMemcpyEngines

设备上的内存复制引擎数量。

uint32_t numMultiprocessors

设备上的多处理器数量。

uint32_t maxIPC

每个设备多处理器上可能的最大“每周期指令数”。

uint32_t maxWarpsPerMultiprocessor

在任何给定时间,一个多处理器上可以存在的最大 Warp 数量。

uint32_t maxBlocksPerMultiprocessor

在任何给定时间,一个多处理器上可以存在的最大 Block 数量。

uint32_t maxSharedMemoryPerMultiprocessor

每个多处理器可用的最大共享内存量,单位为字节。

uint32_t maxRegistersPerMultiprocessor

每个多处理器可用的最大 32 位寄存器数量。

uint32_t maxRegistersPerBlock

可以分配给一个 Block 的最大寄存器数量。

uint32_t maxSharedMemoryPerBlock

可以分配给一个 Block 的最大共享内存量,单位为字节。

uint32_t maxThreadsPerBlock

一个 Block 中允许的最大线程数。

uint32_t maxBlockDimX

一个 Block 允许的最大 X 维度。

uint32_t maxBlockDimY

一个 Block 允许的最大 Y 维度。

uint32_t maxBlockDimZ

一个 Block 允许的最大 Z 维度。

uint32_t maxGridDimX

一个 Grid 允许的最大 X 维度。

uint32_t maxGridDimY

一个 Grid 允许的最大 Y 维度。

uint32_t maxGridDimZ

一个 Grid 允许的最大 Z 维度。

uint32_t computeCapabilityMajor

设备的计算能力,主版本号。

uint32_t computeCapabilityMinor

设备的计算能力,次版本号。

uint32_t id

设备 ID。

uint32_t eccEnabled

设备的 ECC 启用标志。

CUuuid uuid

设备 UUID。

此值是设备的全局唯一不可变的字母数字标识符。

const char *name

设备名称。

此名称在表示设备实例的所有活动记录之间共享,因此不应修改。

uint8_t isCudaVisible

标志,指示设备是否对 CUDA 可见。

用户可以使用 CUDA_VISIBLE_DEVICES 环境变量设置设备可见性

uint8_t isMigEnabled

设备的 MIG 启用标志。

uint32_t gpuInstanceId

对于启用 MIG 的设备,GPU 实例 ID。

如果禁用 mig 模式,则值设置为 UINT32_MAX

uint32_t computeInstanceId

对于启用 MIG 的设备,计算实例 ID。

如果禁用 mig 模式,则值设置为 UINT32_MAX

CUuuid migUuid

MIG UUID。

此值是设备的全局唯一不可变的字母数字标识符。

uint32_t isNumaNode

Numa(非统一内存访问)信息,用于指示设备 GPU 是否为 NUMA 节点。

uint32_t numaId

Numa(非统一内存访问)信息,用于指示设备 GPU 内存的 NUMA 节点 ID。如果 GPU 不是 NUMA 节点,则返回 invalidNumaId。