6.75. CUpti_ActivityNvLink3

struct CUpti_ActivityNvLink3

NVLink 信息。

此结构提供了两个设备之间每个逻辑 NVLink 连接的功能,gpu<->gpu 或 gpu<->CPU,可用于了解拓扑结构。NvLink 信息现在使用 CUpti_ActivityNvLink4 活动记录报告。

公共成员

CUpti_ActivityKind kind

活动记录类型,必须是 CUPTI_ACTIVITY_KIND_NVLINK。

uint32_t nvlinkVersion

NvLink 版本。

CUpti_DevType typeDev0

设备 0 的类型 CUpti_DevType

CUpti_DevType typeDev1

设备 1 的类型 CUpti_DevType

uint32_t index

NPU 的索引。

第一个索引始终为零。

uint32_t domainId

NPU 的域 ID。

在 Linux 上,可以使用 lspci 查询。

union CUpti_ActivityNvLink3::[anonymous] idDev0

如果 typeDev0 是 CUPTI_DEV_TYPE_GPU,则为设备 0 的 UUID。

CUpti_ActivityDevice5。如果 typeDev0 是 CUPTI_DEV_TYPE_NPU,则为 NPU 的 struct npu。

union CUpti_ActivityNvLink3::[anonymous] idDev1

如果 typeDev1 是 CUPTI_DEV_TYPE_GPU,则为设备 1 的 UUID。

CUpti_ActivityDevice5。如果 typeDev1 是 CUPTI_DEV_TYPE_NPU,则为 NPU 的 struct npu。

uint32_t flag

标志给出了链接的功能。

另请参阅

CUpti_LinkFlag

uint32_t physicalNvLinkCount

两个设备之间存在的物理 NVLink 的数量。

int8_t portDev0[CUPTI_MAX_NVLINK_PORTS]

连接到设备 0 的最多 16 个 NVLink 的端口号。

如果 typeDev0 是 CUPTI_DEV_TYPE_NPU,请忽略此字段。如果端口号无效/未知,此字段将设置为值 CUPTI_NVLINK_INVALID_PORT。这将用于将指标值与拓扑中的各个物理链接和属性流量关联到逻辑 NVLink。

int8_t portDev1[CUPTI_MAX_NVLINK_PORTS]

连接到设备 1 的最多 16 个 NVLink 的端口号。

如果 typeDev1 是 CUPTI_DEV_TYPE_NPU,请忽略此字段。如果端口号无效/未知,此字段将设置为值 CUPTI_NVLINK_INVALID_PORT。这将用于将指标值与拓扑中的各个物理链接和属性流量关联到逻辑 NVLink。

uint64_t bandwidth

NVLink 的带宽,单位为 kbytes/秒。

uint8_t nvswitchConnected

NVSwitch 作为中间节点连接。

uint8_t pad[7]

未定义。

保留供内部使用