6.73. CUpti_ActivityNvLink
-
struct CUpti_ActivityNvLink
NVLink 信息。
(在 CUDA 9.0 中已弃用)
此结构提供两个设备(gpu<->gpu 或 gpu<->CPU)之间每个逻辑 NVLink 连接的功能,可用于了解拓扑。NVLink 信息现在使用 CUpti_ActivityNvLink2 活动记录报告。
公共成员
-
CUpti_ActivityKind kind
活动记录类型,必须是 CUPTI_ACTIVITY_KIND_NVLINK。
-
uint32_t nvlinkVersion
NVLink 版本。
-
CUpti_DevType typeDev0
设备 0 的类型 CUpti_DevType。
-
CUpti_DevType typeDev1
设备 1 的类型 CUpti_DevType。
-
uint32_t index
NPU 的索引。
第一个索引将始终为零。
-
uint32_t domainId
NPU 的域 ID。
在 Linux 上,可以使用 lspci 查询。
-
union CUpti_ActivityNvLink::[anonymous] idDev0
如果 typeDev0 是 CUPTI_DEV_TYPE_GPU,则为设备 0 的 UUID。
CUpti_ActivityDevice5。如果 typeDev0 是 CUPTI_DEV_TYPE_NPU,则为 NPU 的结构 npu。
-
union CUpti_ActivityNvLink::[anonymous] idDev1
如果 typeDev1 是 CUPTI_DEV_TYPE_GPU,则为设备 1 的 UUID。
CUpti_ActivityDevice5。如果 typeDev1 是 CUPTI_DEV_TYPE_NPU,则为 NPU 的结构 npu。
-
uint32_t flag
标志给出链路的功能。
-
uint32_t physicalNvLinkCount
两个设备之间存在的物理 NVLink 数量。
-
int8_t portDev0[4]
连接到设备 0 的最多 4 个 NVLink 的端口号。
如果 typeDev0 是 CUPTI_DEV_TYPE_NPU,则忽略此字段。如果端口号无效/未知,则此字段将设置为值 CUPTI_NVLINK_INVALID_PORT。这将用于将度量值与单个物理链路相关联,并将流量归因于拓扑中的逻辑 NVLink。
-
int8_t portDev1[4]
连接到设备 1 的最多 4 个 NVLink 的端口号。
如果 typeDev1 是 CUPTI_DEV_TYPE_NPU,则忽略此字段。如果端口号无效/未知,则此字段将设置为值 CUPTI_NVLINK_INVALID_PORT。这将用于将度量值与单个物理链路相关联,并将流量归因于拓扑中的逻辑 NVLink。
-
uint64_t bandwidth
NVLink 的带宽,单位为千字节/秒。
-
CUpti_ActivityKind kind