拓扑

group DCGMAPI_TOPOLOGY

本章介绍查询 DCGM 拓扑信息的方法。

函数

dcgmReturn_t dcgmSelectGpusByTopology(dcgmHandle_t pDcgmHandle, uint64_t inputGpuIds, uint32_t numGpus, uint64_t *outputGpuIds, uint64_t hintFlags)

根据拓扑邻近性:CPU 亲和性、NUMA 节点和 NVLink,从指定的位掩码中获取最佳的 GPU 组。

参数:
  • pDcgmHandle – IN: DCGM 句柄

  • inputGpuIds – IN: DCGM 应考虑的 GPU 的位掩码。如果系统上的某些 GPU 已经在使用中,则不应将其包含在位掩码中。0 表示应考虑系统中的所有 GPU。

  • numGpus – IN: 从 inputGpuIds 中所需的 GPU 数量。如果此数字大于 inputGpuIds 中健康 GPU 的数量,则在 outputGpuIds 中指定的 GPU 将少于 numGpus。

  • outputGpuIds – OUT: 来自 inputGpuIds 的 numGpus 或更少 GPU 的位掩码,表示 inputGpuIds 中可用的最佳位置。

  • hintFlags – IN: DCGM_TOPO_HINT_F_ #defines 的位掩码,在分配 outputGpuIds 时应考虑这些提示。

返回值: