6.15. CUpti_ActivityDevice4

struct CUpti_ActivityDevice4

设备的活动记录。

(CUDA 11.6 及更高版本)

此活动记录表示关于 GPU 设备(CUPTI_ACTIVITY_KIND_DEVICE)的信息。设备活动现在使用 CUpti_ActivityDevice5 活动记录报告。

公共成员

CUpti_ActivityKind kind

活动记录类型,必须是 CUPTI_ACTIVITY_KIND_DEVICE。

CUpti_ActivityFlag flags

与设备关联的标志。

另请参阅

CUpti_ActivityFlag

uint64_t globalMemoryBandwidth

设备上可用的全局内存带宽,单位为千字节/秒。

uint64_t globalMemorySize

设备上的全局内存量,单位为字节。

uint32_t constantMemorySize

设备上的常量内存量,单位为字节。

uint32_t l2CacheSize

设备上 L2 缓存的大小,单位为字节。

uint32_t numThreadsPerWarp

设备上每个 Warp 的线程数。

uint32_t coreClockRate

设备的核心时钟频率,单位为 kHz。

uint32_t numMemcpyEngines

设备上的内存复制引擎数量。

uint32_t numMultiprocessors

设备上的多处理器数量。

uint32_t maxIPC

每个设备多处理器上可能的最大“每周期指令数”。

uint32_t maxWarpsPerMultiprocessor

在任何给定时间,多处理器上可以存在的最大 Warp 数量。

uint32_t maxBlocksPerMultiprocessor

在任何给定时间,多处理器上可以存在的最大块数量。

uint32_t maxSharedMemoryPerMultiprocessor

每个多处理器可用的最大共享内存量,单位为字节。

uint32_t maxRegistersPerMultiprocessor

每个多处理器可用的最大 32 位寄存器数量。

uint32_t maxRegistersPerBlock

可以分配给一个块的最大寄存器数量。

uint32_t maxSharedMemoryPerBlock

可以分配给一个块的最大共享内存量,单位为字节。

uint32_t maxThreadsPerBlock

一个块中允许的最大线程数。

uint32_t maxBlockDimX

块的最大允许 X 维度。

uint32_t maxBlockDimY

块的最大允许 Y 维度。

uint32_t maxBlockDimZ

块的最大允许 Z 维度。

uint32_t maxGridDimX

网格的最大允许 X 维度。

uint32_t maxGridDimY

网格的最大允许 Y 维度。

uint32_t maxGridDimZ

网格的最大允许 Z 维度。

uint32_t computeCapabilityMajor

设备的计算能力,主版本号。

uint32_t computeCapabilityMinor

设备的计算能力,次版本号。

uint32_t id

设备 ID。

uint32_t eccEnabled

设备的 ECC 启用标志。

CUuuid uuid

设备 UUID。

此值是设备的全局唯一不可变的字母数字标识符。

const char *name

设备名称。

此名称在表示设备实例的所有活动记录之间共享,因此不应修改。

uint8_t isCudaVisible

标志,指示设备是否对 CUDA 可见。

用户可以使用 CUDA_VISIBLE_DEVICES 环境变量设置设备可见性

uint8_t isMigEnabled

设备的 MIG 启用标志。

uint32_t gpuInstanceId

启用 MIG 的设备的 GPU 实例 ID。

如果禁用 mig 模式,则值设置为 UINT32_MAX

uint32_t computeInstanceId

启用 MIG 的设备的计算实例 ID。

如果禁用 mig 模式,则值设置为 UINT32_MAX

CUuuid migUuid

MIG UUID。

此值是设备的全局唯一不可变的字母数字标识符。