4.3. 字段值枚举
类
宏定义
- #define NVML_FI_DEV_C2C_LINK_COUNT 170
- 设备上存在的 C2C 链接数量。
- #define NVML_FI_DEV_C2C_LINK_GET_MAX_BW 172
- 活跃链接的 C2C 链接速度,单位为 MBps。
- #define NVML_FI_DEV_C2C_LINK_GET_STATUS 171
- C2C 链接状态 0=非活跃 1=活跃。
- #define NVML_FI_DEV_DRAIN_AND_RESET_STATUS 227
- 已弃用,请勿使用(请使用 NVML_FI_DEV_GET_GPU_RECOVERY_ACTION 代替)。
- #define NVML_FI_DEV_ECC_CURRENT 1
- 当前 ECC 模式。1=激活。0=未激活。
- #define NVML_FI_DEV_ECC_DBE_AGG_CBU 28
- CBU 双比特聚合 ECC 错误。
- #define NVML_FI_DEV_ECC_DBE_AGG_DEV 23
- 设备内存双比特聚合(持久性)ECC 错误。
- #define NVML_FI_DEV_ECC_DBE_AGG_L1 19
- L1 缓存双比特聚合(持久性)ECC 错误。
- #define NVML_FI_DEV_ECC_DBE_AGG_L2 21
- L2 缓存双比特聚合(持久性)ECC 错误。
- #define NVML_FI_DEV_ECC_DBE_AGG_REG 25
- 寄存器文件双比特聚合(持久性)ECC 错误。
- #define NVML_FI_DEV_ECC_DBE_AGG_TEX 27
- 纹理内存双比特聚合(持久性)ECC 错误。
- #define NVML_FI_DEV_ECC_DBE_AGG_TOTAL 6
- 总计双比特聚合(持久性)ECC 错误。
- #define NVML_FI_DEV_ECC_DBE_VOL_CBU 17
- CBU 双比特易失性 ECC 错误。
- #define NVML_FI_DEV_ECC_DBE_VOL_DEV 12
- 设备内存双比特易失性 ECC 错误。
- #define NVML_FI_DEV_ECC_DBE_VOL_L1 8
- L1 缓存双比特易失性 ECC 错误。
- #define NVML_FI_DEV_ECC_DBE_VOL_L2 10
- L2 缓存双比特易失性 ECC 错误。
- #define NVML_FI_DEV_ECC_DBE_VOL_REG 14
- 寄存器文件双比特易失性 ECC 错误。
- #define NVML_FI_DEV_ECC_DBE_VOL_TEX 16
- 纹理内存双比特易失性 ECC 错误。
- #define NVML_FI_DEV_ECC_DBE_VOL_TOTAL 4
- 总计双比特易失性 ECC 错误。
- #define NVML_FI_DEV_ECC_PENDING 2
- 待定 ECC 模式。1=激活。0=未激活。
- #define NVML_FI_DEV_ECC_SBE_AGG_DEV 22
- 设备内存单比特聚合(持久性)ECC 错误。
- #define NVML_FI_DEV_ECC_SBE_AGG_L1 18
- L1 缓存单比特聚合(持久性)ECC 错误。
- #define NVML_FI_DEV_ECC_SBE_AGG_L2 20
- L2 缓存单比特聚合(持久性)ECC 错误。
- #define NVML_FI_DEV_ECC_SBE_AGG_REG 24
- 寄存器文件单比特聚合(持久性)ECC 错误。
- #define NVML_FI_DEV_ECC_SBE_AGG_TEX 26
- 纹理内存单比特聚合(持久性)ECC 错误。
- #define NVML_FI_DEV_ECC_SBE_AGG_TOTAL 5
- 总计单比特聚合(持久性)ECC 错误。
- #define NVML_FI_DEV_ECC_SBE_VOL_DEV 11
- 设备内存单比特易失性 ECC 错误。
- #define NVML_FI_DEV_ECC_SBE_VOL_L1 7
- L1 缓存单比特易失性 ECC 错误。
- #define NVML_FI_DEV_ECC_SBE_VOL_L2 9
- L2 缓存单比特易失性 ECC 错误。
- #define NVML_FI_DEV_ECC_SBE_VOL_REG 13
- 寄存器文件单比特易失性 ECC 错误。
- #define NVML_FI_DEV_ECC_SBE_VOL_TEX 15
- 纹理内存单比特易失性 ECC 错误。
- #define NVML_FI_DEV_ECC_SBE_VOL_TOTAL 3
- 总计单比特易失性 ECC 错误。
- #define NVML_FI_DEV_ENERGY 191
- 自上次驱动程序重新加载以来,总能耗(单位为 mJ)。与 GPU 的 NVML_FI_DEV_TOTAL_ENERGY_CONSUMPTION 相同。
- #define NVML_FI_DEV_GET_GPU_RECOVERY_ACTION 230
- GPU 恢复操作 - 无/重置/重启/耗尽 P2P/耗尽并重置。
- #define NVML_FI_DEV_IS_MIG_MODE_INDEPENDENT_MIG_QUERY_CAPABLE 199
- MIG 模式独立,支持 MIG 查询的设备。1=是。0=否。
- #define NVML_FI_DEV_IS_RESETLESS_MIG_SUPPORTED 184
- 设备的无重置 MIG 能力。
- #define NVML_FI_DEV_MEMORY_TEMP 82
- 设备的内存温度。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L0 60
- 计数器集 0,通道 0 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L1 61
- 计数器集 0,通道 1 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L10 124
- 计数器集 0,通道 10 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L11 125
- 计数器集 0,通道 11 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L2 62
- 计数器集 0,通道 2 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L3 63
- 计数器集 0,通道 3 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L4 64
- 计数器集 0,通道 4 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L5 65
- 计数器集 0,通道 5 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L6 120
- 计数器集 0,通道 6 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L7 121
- 计数器集 0,通道 7 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L8 122
- 计数器集 0,通道 8 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L9 123
- 计数器集 0,通道 9 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_TOTAL 66
- 计数器集 0,所有通道的 NVLink 总带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L0 67
- 计数器集 1,通道 0 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L1 68
- 计数器集 1,通道 1 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L10 130
- 计数器集 1,通道 10 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L11 131
- 计数器集 1,通道 11 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L2 69
- 计数器集 1,通道 2 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L3 70
- 计数器集 1,通道 3 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L4 71
- 计数器集 1,通道 4 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L5 72
- 计数器集 1,通道 5 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L6 126
- 计数器集 1,通道 6 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L7 127
- 计数器集 1,通道 7 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L8 128
- 计数器集 1,通道 8 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L9 129
- 计数器集 1,通道 9 的 NVLink 带宽计数器。
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_TOTAL 73
- 计数器集 1,所有通道的 NVLink 总带宽计数器。
- #define NVML_FI_DEV_NVLINK_COUNT_BUFFER_OVERRUN_ERRORS 207
- 由于缓冲区溢出,在 Rx 上丢弃的数据包数量。
- #define NVML_FI_DEV_NVLINK_COUNT_EFFECTIVE_BER 220
- 有效错误的有效 BER。
- #define NVML_FI_DEV_NVLINK_COUNT_EFFECTIVE_ERRORS 219
- 每个 Nvlink 数据包中错误数量的总和。
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_0 235
- 已纠正的符号错误计数 - bin 0。
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_1 236
- 已纠正的符号错误计数 - bin 1。
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_10 245
- 已纠正的符号错误计数 - bin 10。
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_11 246
- 已纠正的符号错误计数 - bin 11。
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_12 247
- 已纠正的符号错误计数 - bin 12。
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_13 248
- 已纠正的符号错误计数 - bin 13。
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_14 249
- 已纠正的符号错误计数 - bin 14。
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_15 250
- 已纠正的符号错误计数 - bin 15。
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_2 237
- 已纠正的符号错误计数 - bin 2。
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_3 238
- 已纠正的符号错误计数 - bin 3。
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_4 239
- 已纠正的符号错误计数 - bin 4。
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_5 240
- 已纠正的符号错误计数 - bin 5。
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_6 241
- 已纠正的符号错误计数 - bin 6。
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_7 242
- 已纠正的符号错误计数 - bin 7。
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_8 243
- 已纠正的符号错误计数 - bin 8。
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_9 244
- 已纠正的符号错误计数 - bin 9。
- #define NVML_FI_DEV_NVLINK_COUNT_LINK_RECOVERY_EVENTS 215
- 链路从“Up”状态变为恢复状态的次数,与结果无关。
- #define NVML_FI_DEV_NVLINK_COUNT_LINK_RECOVERY_FAILED_EVENTS 214
- 链路从“Up”状态变为恢复状态,但恢复失败,并且链路被声明为“down”状态的次数。
- #define NVML_FI_DEV_NVLINK_COUNT_LINK_RECOVERY_SUCCESSFUL_EVENTS 213
- 链路从“Up”状态变为恢复状态,但恢复成功,并且链路恢复为“up”状态的次数。
- #define NVML_FI_DEV_NVLINK_COUNT_LOCAL_LINK_INTEGRITY_ERRORS 211
- 本地错误计数超过阈值的总次数。
- #define NVML_FI_DEV_NVLINK_COUNT_MALFORMED_PACKET_ERRORS 206
- 在链路上接收到格式错误的数据包数量。
- #define NVML_FI_DEV_NVLINK_COUNT_RAW_BER 218
- 已弃用,请勿使用。
- #define NVML_FI_DEV_NVLINK_COUNT_RAW_BER_LANE0 216
- 已弃用,请勿使用。
- #define NVML_FI_DEV_NVLINK_COUNT_RAW_BER_LANE1 217
- 已弃用,请勿使用。
- #define NVML_FI_DEV_NVLINK_COUNT_RCV_BYTES 204
- NVLink5 中链路上的总接收字节数。
- #define NVML_FI_DEV_NVLINK_COUNT_RCV_ERRORS 208
- 在链路上接收到错误数据包的总数。
- #define NVML_FI_DEV_NVLINK_COUNT_RCV_GENERAL_ERRORS 210
- 接收到具有头部不匹配的数据包总数。
- #define NVML_FI_DEV_NVLINK_COUNT_RCV_PACKETS 203
- NVLink5 中链路上的总接收数据包数。
- #define NVML_FI_DEV_NVLINK_COUNT_RCV_REMOTE_ERRORS 209
- 接收到的数据包总数 - 冲突/EBP 标记。
- #define NVML_FI_DEV_NVLINK_COUNT_SYMBOL_BER 222
- 符号错误的 BER。
- #define NVML_FI_DEV_NVLINK_COUNT_SYMBOL_ERRORS 221
- rx 符号中的错误数。
- #define NVML_FI_DEV_NVLINK_COUNT_VL15_DROPPED 205
- 已弃用,请勿使用。
- #define NVML_FI_DEV_NVLINK_COUNT_XMIT_BYTES 202
- NVLink5 中链路上的总发送字节数。
- #define NVML_FI_DEV_NVLINK_COUNT_XMIT_DISCARDS 212
- 丢弃的 tx 错误数据包总数。
- #define NVML_FI_DEV_NVLINK_COUNT_XMIT_PACKETS 201
- NVLink5 中链路上的总发送数据包数。
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L0 39
- 通道 0 的 NVLink 数据 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L1 40
- 通道 1 的 NVLink 数据 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L10 106
- 通道 10 的 NVLink 数据 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L11 107
- 通道 11 的 NVLink 数据 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L2 41
- 通道 2 的 NVLink 数据 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L3 42
- 通道 3 的 NVLink 数据 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L4 43
- 通道 4 的 NVLink 数据 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L5 44
- 通道 5 的 NVLink 数据 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L6 102
- 通道 6 的 NVLink 数据 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L7 103
- 通道 7 的 NVLink 数据 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L8 104
- 通道 8 的 NVLink 数据 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L9 105
- 通道 9 的 NVLink 数据 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_TOTAL 45
- 所有通道的 NvLink 数据 CRC 错误计数器总计。
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L0 32
- 通道 0 的 NVLink 流控制 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L1 33
- 通道 1 的 NVLink 流控制 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L10 100
- 通道 10 的 NVLink 流控制 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L11 101
- 通道 11 的 NVLink 流控制 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L2 34
- 通道 2 的 NVLink 流控制 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L3 35
- 通道 3 的 NVLink 流控制 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L4 36
- 通道 4 的 NVLink 流控制 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L5 37
- 通道 5 的 NVLink 流控制 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L6 96
- 通道 6 的 NVLink 流控制 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L7 97
- 通道 7 的 NVLink 流控制 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L8 98
- 通道 8 的 NVLink 流控制 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L9 99
- 通道 9 的 NVLink 流控制 CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_TOTAL 38
- 所有通道的 NVLink 流控制 CRC 错误计数器总计。
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L0 148
- 链路 0 的 NVLink 数据 ECC 错误计数器。
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L1 149
- 链路 1 的 NVLink 数据 ECC 错误计数器。
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L10 158
- 链路 10 的 NVLink 数据 ECC 错误计数器。
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L11 159
- 链路 11 的 NVLink 数据 ECC 错误计数器。
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L2 150
- 链路 2 的 NVLink 数据 ECC 错误计数器。
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L3 151
- 链路 3 的 NVLink 数据 ECC 错误计数器。
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L4 152
- 链路 4 的 NVLink 数据 ECC 错误计数器。
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L5 153
- 链路 5 的 NVLink 数据 ECC 错误计数器。
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L6 154
- 链路 6 的 NVLink 数据 ECC 错误计数器。
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L7 155
- 链路 7 的 NVLink 数据 ECC 错误计数器。
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L8 156
- 链路 8 的 NVLink 数据 ECC 错误计数器。
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L9 157
- 链路 9 的 NVLink 数据 ECC 错误计数器。
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_TOTAL 160
- 所有链路的 NVLink 数据 ECC 错误计数器总计。
- #define NVML_FI_DEV_NVLINK_ERROR_DL_CRC 163
- NVLink CRC 错误计数器。
- #define NVML_FI_DEV_NVLINK_ERROR_DL_RECOVERY 162
- NVLink 恢复错误计数器。
- #define NVML_FI_DEV_NVLINK_ERROR_DL_REPLAY 161
- NVLink 重放错误计数器。
- #define NVML_FI_DEV_NVLINK_GET_POWER_STATE 167
- NVLink 电源状态。 0=高速 1=低速。
- #define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD 168
- NVLink 空闲周期长度(单位可以在以下位置找到)。
- #define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD_MAX 200
- 最大 Nvlink 功耗阈值。 请参阅 NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD。
- #define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD_MIN 223
- 最小 Nvlink 功耗阈值。 请参阅 NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD。
- #define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD_SUPPORTED 225
- 确定是否支持 Nvlink 功耗阈值功能。
- #define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD_UNITS 224
- 值采用 NVML_NVLINK_LOW_POWER_THRESHOLD_UNIT_* 的形式。
- #define NVML_FI_DEV_NVLINK_GET_SPEED 164
- NVLink 速度,单位为 MBps。
- #define NVML_FI_DEV_NVLINK_GET_STATE 165
- NVLink 状态 - 活动、非活动。
- #define NVML_FI_DEV_NVLINK_GET_VERSION 166
- NVLink 版本。
- #define NVML_FI_DEV_NVLINK_LINK_COUNT 91
- 设备上存在的 NVLink 数量。
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L0 53
- 通道 0 的 NVLink 恢复错误计数器。
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L1 54
- 通道 1 的 NVLink 恢复错误计数器。
- 通道 10 的 NVLink 恢复错误计数器。
- 通道 10 的 NVLink 恢复错误计数器。
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L11 119
- 通道 11 的 NVLink 恢复错误计数器。
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L2 55
- 通道 2 的 NVLink 恢复错误计数器。
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L3 56
- 通道 3 的 NVLink 恢复错误计数器。
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L4 57
- 通道 4 的 NVLink 恢复错误计数器。
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L5 58
- 通道 5 的 NVLink 恢复错误计数器。
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L6 114
- 通道 6 的 NVLink 恢复错误计数器。
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L7 115
- 通道 7 的 NVLink 恢复错误计数器。
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L8 116
- 通道 8 的 NVLink 恢复错误计数器。
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L9 117
- 通道 9 的 NVLink 恢复错误计数器。
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_TOTAL 59
- 所有通道的 NVLink 恢复错误计数器总计。
- #define NVML_FI_DEV_NVLINK_REMOTE_NVLINK_ID 146
- 远程设备 NVLink ID。
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L0 46
- 通道 0 的 NVLink 重放错误计数器。
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L1 47
- 通道 1 的 NVLink 重放错误计数器。
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L10 112
- 通道 10 的 NVLink 重放错误计数器。
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L11 113
- 通道 11 的 NVLink 重放错误计数器。
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L2 48
- 通道 2 的 NVLink 重放错误计数器。
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L3 49
- 通道 3 的 NVLink 重放错误计数器。
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L4 50
- 通道 4 的 NVLink 重放错误计数器。
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L5 51
- 通道 5 的 NVLink 重放错误计数器。
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L6 108
- 通道 6 的 NVLink 重放错误计数器。
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L7 109
- 通道 7 的 NVLink 重放错误计数器。
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L8 110
- 通道 8 的 NVLink 重放错误计数器。
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L9 111
- 通道 9 的 NVLink 重放错误计数器。
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_TOTAL 52
- 所有通道的 NVLink 重放错误计数器总计。
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_COMMON 90
- 活动链接的通用 NVLink 速度,单位为 MBps。
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L0 84
- 链接 0 的 NVLink 速度,单位为 MBps。
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L1 85
- 链接 1 的 NVLink 速度,单位为 MBps。
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L10 136
- 链接 10 的 NVLink 速度,单位为 MBps。
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L11 137
- 链接 11 的 NVLink 速度,单位为 MBps。
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L2 86
- 链接 2 的 NVLink 速度,单位为 MBps。
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L3 87
- 链接 3 的 NVLink 速度,单位为 MBps。
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L4 88
- 链接 4 的 NVLink 速度,单位为 MBps。
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L5 89
- 链接 5 的 NVLink 速度,单位为 MBps。
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L6 132
- 链接 6 的 NVLink 速度,单位为 MBps。
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L7 133
- 链接 7 的 NVLink 速度,单位为 MBps。
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L8 134
- 链接 8 的 NVLink 速度,单位为 MBps。
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L9 135
- 链接 9 的 NVLink 速度,单位为 MBps。
- #define NVML_FI_DEV_NVLINK_THROUGHPUT_DATA_RX 139
- NVLink 接收数据吞吐量,单位为 KiB。
- #define NVML_FI_DEV_NVLINK_THROUGHPUT_DATA_TX 138
- NVLink 发送数据吞吐量,单位为 KiB。
- #define NVML_FI_DEV_NVLINK_THROUGHPUT_RAW_RX 141
- NVLink 原始接收数据 + 协议开销,单位为 KiB。
- #define NVML_FI_DEV_NVLINK_THROUGHPUT_RAW_TX 140
- NVLink 原始发送数据 + 协议开销,单位为 KiB。
- #define NVML_FI_DEV_NVSWITCH_CONNECTED_LINK_COUNT 147
- 连接到 NVSwitch 的 NVLink 数量。
- #define NVML_FI_DEV_PCIE_COUNT_BAD_DLLP 178
- PCIe 坏 DLLP 计数器。
- #define NVML_FI_DEV_PCIE_COUNT_BAD_TLP 176
- PCIe 坏 TLP 计数器。
- #define NVML_FI_DEV_PCIE_COUNT_CORRECTABLE_ERRORS 173
- PCIe 可纠正错误计数器。
- #define NVML_FI_DEV_PCIE_COUNT_FATAL_ERROR 180
- PCIe 致命错误计数器。
- #define NVML_FI_DEV_PCIE_COUNT_LANE_ERROR 183
- PCIe 每通道错误计数器。
- #define NVML_FI_DEV_PCIE_COUNT_LCRC_ERROR 182
- PCIe LCRC 错误计数器。
- #define NVML_FI_DEV_PCIE_COUNT_NAKS_RECEIVED 174
- PCIe NAK 接收计数器。
- #define NVML_FI_DEV_PCIE_COUNT_NAKS_SENT 177
- PCIe NAK 发送计数器。
- #define NVML_FI_DEV_PCIE_COUNT_NON_FATAL_ERROR 179
- PCIe 非致命错误计数器。
- #define NVML_FI_DEV_PCIE_COUNT_RECEIVER_ERROR 175
- PCIe 接收器错误计数器。
- #define NVML_FI_DEV_PCIE_COUNT_RX_BYTES 198
- PCIe 接收字节数。 值可能回绕。
- #define NVML_FI_DEV_PCIE_COUNT_TX_BYTES 197
- PCIe 发送字节数。 值可能回绕。
- #define NVML_FI_DEV_PCIE_COUNT_UNSUPPORTED_REQ 181
- PCIe 不支持的请求计数器。
- #define NVML_FI_DEV_PCIE_L0_TO_RECOVERY_COUNTER 169
- 设备 PEX 错误恢复计数器。
- #define NVML_FI_DEV_PCIE_REPLAY_COUNTER 94
- PCIe 重放计数器。
- #define NVML_FI_DEV_PCIE_REPLAY_ROLLOVER_COUNTER 95
- PCIe 重放翻转计数器。
- #define NVML_FI_DEV_PERF_POLICY_BOARD_LIMIT 77
- 板级限制的性能策略计数器。
- #define NVML_FI_DEV_PERF_POLICY_LOW_UTILIZATION 78
- 低 GPU 利用率策略的性能策略计数器。
- #define NVML_FI_DEV_PERF_POLICY_POWER 74
- 功耗策略的性能策略计数器。
- #define NVML_FI_DEV_PERF_POLICY_RELIABILITY 79
- 可靠性策略的性能策略计数器。
- #define NVML_FI_DEV_PERF_POLICY_SYNC_BOOST 76
- 同步加速策略的性能策略计数器。
- #define NVML_FI_DEV_PERF_POLICY_THERMAL 75
- 散热策略的性能策略计数器。
- #define NVML_FI_DEV_PERF_POLICY_TOTAL_APP_CLOCKS 80
- 总应用时钟策略的性能策略计数器。
- #define NVML_FI_DEV_PERF_POLICY_TOTAL_BASE_CLOCKS 81
- 总基本时钟策略的性能策略计数器。
- #define NVML_FI_DEV_POWER_AVERAGE 185
- GPU 功耗 1 秒间隔平均值,在 Ampere(GA100 除外)或更新的架构上受支持。
- #define NVML_FI_DEV_POWER_CURRENT_LIMIT 190
- 当前强制执行的限制,单位为毫瓦(包括在其他地方设置的其他限制,例如带外)。
- #define NVML_FI_DEV_POWER_DEFAULT_LIMIT 189
- 默认功耗限制,单位为毫瓦(设备启动时的限制)。
- #define NVML_FI_DEV_POWER_INSTANT 186
- 当前 GPU 功耗,在所有架构上均受支持。
- #define NVML_FI_DEV_POWER_MAX_LIMIT 188
- 最大功耗限制,单位为毫瓦。
- #define NVML_FI_DEV_POWER_MIN_LIMIT 187
- 最小功耗限制,单位为毫瓦。
- #define NVML_FI_DEV_POWER_REQUESTED_LIMIT 192
- 由 NVML 或任何其他用户空间客户端请求的功耗限制。
- #define NVML_FI_DEV_REMAPPED_COR 142
- 由于可纠正错误而重新映射的行数。
- #define NVML_FI_DEV_REMAPPED_FAILURE 145
- 是否有任何行重新映射失败 1=是 0=否。
- #define NVML_FI_DEV_REMAPPED_PENDING 144
- 是否有任何行正在等待重新映射。 1=是 0=否。
- #define NVML_FI_DEV_REMAPPED_UNC 143
- 由于不可纠正错误而重新映射的行数。
- #define NVML_FI_DEV_RESET_STATUS 226
- 已弃用,请勿使用(请改用 NVML_FI_DEV_GET_GPU_RECOVERY_ACTION)。
- #define NVML_FI_DEV_RETIRED_DBE 30
- 由于双位错误而停用的页面数量。
- #define NVML_FI_DEV_RETIRED_PENDING 31
- 是否有任何页面正在等待停用。 1=是。 0=否。
- #define NVML_FI_DEV_RETIRED_PENDING_DBE 93
- 是否有任何页面因 DBE 而正在等待停用。 1=是。 0=否。
- #define NVML_FI_DEV_RETIRED_PENDING_SBE 92
- 是否有任何页面因 SBE 而正在等待停用。 1=是。 0=否。
- #define NVML_FI_DEV_RETIRED_SBE 29
- 由于单位错误而停用的页面数量。
- #define NVML_FI_DEV_TEMPERATURE_GPU_MAX_TLIMIT 196
- T.Limit 温度,超过此温度 GPU 可能会被限制到基本时钟以下。
- #define NVML_FI_DEV_TEMPERATURE_MEM_MAX_TLIMIT 195
- T.Limit 温度,超过此温度 GPU 可能会因内存温度开始 SW 减速。
- #define NVML_FI_DEV_TEMPERATURE_SHUTDOWN_TLIMIT 193
- T.Limit 温度,超过此温度 GPU 可能会因硬件保护而关闭。
- #define NVML_FI_DEV_TEMPERATURE_SLOWDOWN_TLIMIT 194
- T.Limit 温度,超过此温度 GPU 可能会开始硬件减速。
- #define NVML_FI_DEV_TOTAL_ENERGY_CONSUMPTION 83
- 自上次重新加载驱动程序以来 GPU 的总能耗,单位为 mJ。
- #define NVML_FI_MAX 269
- 比上面定义的最大字段 ID 大一。
- #define NVML_FI_PWR_SMOOTHING_ACTIVE_PRESET_PROFILE 264
- 活动预设配置文件编号。
- #define NVML_FI_PWR_SMOOTHING_ADMIN_OVERRIDE_PERCENT_TMP_FLOOR 265
- 给定配置文件的 % TMP 下限值
- #define NVML_FI_PWR_SMOOTHING_ADMIN_OVERRIDE_RAMP_DOWN_HYST_VAL 268
- 给定配置文件的 ramp down 滞后值,单位为 ms。
- #define NVML_FI_PWR_SMOOTHING_ADMIN_OVERRIDE_RAMP_DOWN_RATE 267
- 给定配置文件的 ramp down 速率,单位为 mW/s。
- #define NVML_FI_PWR_SMOOTHING_ADMIN_OVERRIDE_RAMP_UP_RATE 266
- 给定配置文件的 ramp up 速率,单位为 mW/s。
- #define NVML_FI_PWR_SMOOTHING_APPLIED_TMP_CEIL 254
- 应用的 TMP 上限值,单位为瓦特。
- #define NVML_FI_PWR_SMOOTHING_APPLIED_TMP_FLOOR 255
- 应用的 TMP 下限值,单位为瓦特。
- #define NVML_FI_PWR_SMOOTHING_ENABLED 251
- 启用状态 (0/禁用或 1/启用)。
- #define NVML_FI_PWR_SMOOTHING_HW_CIRCUITRY_PERCENT_LIFETIME_REMAINING 258
- 硬件电路 % 剩余寿命。
- #define NVML_FI_PWR_SMOOTHING_IMM_RAMP_DOWN_ENABLED 253
- 立即 ramp down 启用状态 (0/禁用或 1/启用)。
- #define NVML_FI_PWR_SMOOTHING_MAX_NUM_PRESET_PROFILES 259
- 预设配置文件的最大数量。
- #define NVML_FI_PWR_SMOOTHING_MAX_PERCENT_TMP_FLOOR_SETTING 256
- 最大 % TMP 下限值。
- #define NVML_FI_PWR_SMOOTHING_MIN_PERCENT_TMP_FLOOR_SETTING 257
- 最小 % TMP 下限值。
- #define NVML_FI_PWR_SMOOTHING_PRIV_LVL 252
- 当前权限级别。
- #define NVML_FI_PWR_SMOOTHING_PROFILE_PERCENT_TMP_FLOOR 260
- 给定配置文件的 % TMP 下限值
- #define NVML_FI_PWR_SMOOTHING_PROFILE_RAMP_DOWN_HYST_VAL 263
- 给定配置文件的 ramp down 滞后值,单位为 ms。
- #define NVML_FI_PWR_SMOOTHING_PROFILE_RAMP_DOWN_RATE 262
- 给定配置文件的 ramp down 速率,单位为 mW/s。
- #define NVML_FI_PWR_SMOOTHING_PROFILE_RAMP_UP_RATE 261
- 给定配置文件的 ramp up 速率,单位为 mW/s。
- #define NVML_NVLINK_LOW_POWER_THRESHOLD_UNIT_100US 0x0
- #define NVML_NVLINK_POWER_STATE_HIGH_SPEED 0x0
宏定义
- #define NVML_FI_DEV_C2C_LINK_COUNT 170
-
- #define NVML_FI_DEV_C2C_LINK_GET_MAX_BW 172
-
- #define NVML_FI_DEV_C2C_LINK_GET_STATUS 171
-
- #define NVML_FI_DEV_DRAIN_AND_RESET_STATUS 227
-
- #define NVML_FI_DEV_ECC_CURRENT 1
-
字段标识符。
所有标识符都与设备有关。每个 ID 仅使用一次,并保证永远不会更改。
- #define NVML_FI_DEV_ECC_DBE_AGG_CBU 28
-
- #define NVML_FI_DEV_ECC_DBE_AGG_DEV 23
-
- #define NVML_FI_DEV_ECC_DBE_AGG_L1 19
-
- #define NVML_FI_DEV_ECC_DBE_AGG_L2 21
-
- #define NVML_FI_DEV_ECC_DBE_AGG_REG 25
-
- #define NVML_FI_DEV_ECC_DBE_AGG_TEX 27
-
- #define NVML_FI_DEV_ECC_DBE_AGG_TOTAL 6
-
- #define NVML_FI_DEV_ECC_DBE_VOL_CBU 17
-
- #define NVML_FI_DEV_ECC_DBE_VOL_DEV 12
-
- #define NVML_FI_DEV_ECC_DBE_VOL_L1 8
-
- #define NVML_FI_DEV_ECC_DBE_VOL_L2 10
-
- #define NVML_FI_DEV_ECC_DBE_VOL_REG 14
-
- #define NVML_FI_DEV_ECC_DBE_VOL_TEX 16
-
- #define NVML_FI_DEV_ECC_DBE_VOL_TOTAL 4
-
- #define NVML_FI_DEV_ECC_PENDING 2
-
- #define NVML_FI_DEV_ECC_SBE_AGG_DEV 22
-
- #define NVML_FI_DEV_ECC_SBE_AGG_L1 18
-
- #define NVML_FI_DEV_ECC_SBE_AGG_L2 20
-
- #define NVML_FI_DEV_ECC_SBE_AGG_REG 24
-
- #define NVML_FI_DEV_ECC_SBE_AGG_TEX 26
-
- #define NVML_FI_DEV_ECC_SBE_AGG_TOTAL 5
-
- #define NVML_FI_DEV_ECC_SBE_VOL_DEV 11
-
- #define NVML_FI_DEV_ECC_SBE_VOL_L1 7
-
- #define NVML_FI_DEV_ECC_SBE_VOL_L2 9
-
- #define NVML_FI_DEV_ECC_SBE_VOL_REG 13
-
- #define NVML_FI_DEV_ECC_SBE_VOL_TEX 15
-
- #define NVML_FI_DEV_ECC_SBE_VOL_TOTAL 3
-
- #define NVML_FI_DEV_ENERGY 191
-
- #define NVML_FI_DEV_GET_GPU_RECOVERY_ACTION 230
-
- #define NVML_FI_DEV_IS_MIG_MODE_INDEPENDENT_MIG_QUERY_CAPABLE 199
-
- #define NVML_FI_DEV_IS_RESETLESS_MIG_SUPPORTED 184
-
- #define NVML_FI_DEV_MEMORY_TEMP 82
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L0 60
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L1 61
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L10 124
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L11 125
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L2 62
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L3 63
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L4 64
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L5 65
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L6 120
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L7 121
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L8 122
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L9 123
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_TOTAL 66
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L0 67
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L1 68
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L10 130
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L11 131
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L2 69
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L3 70
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L4 71
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L5 72
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L6 126
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L7 127
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L8 128
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L9 129
-
- #define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_TOTAL 73
-
- #define NVML_FI_DEV_NVLINK_COUNT_BUFFER_OVERRUN_ERRORS 207
-
- #define NVML_FI_DEV_NVLINK_COUNT_EFFECTIVE_BER 220
-
- #define NVML_FI_DEV_NVLINK_COUNT_EFFECTIVE_ERRORS 219
-
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_0 235
-
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_1 236
-
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_10 245
-
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_11 246
-
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_12 247
-
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_13 248
-
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_14 249
-
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_15 250
-
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_2 237
-
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_3 238
-
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_4 239
-
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_5 240
-
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_6 241
-
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_7 242
-
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_8 243
-
- #define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_9 244
-
- #define NVML_FI_DEV_NVLINK_COUNT_LINK_RECOVERY_EVENTS 215
-
- #define NVML_FI_DEV_NVLINK_COUNT_LINK_RECOVERY_FAILED_EVENTS 214
-
- #define NVML_FI_DEV_NVLINK_COUNT_LINK_RECOVERY_SUCCESSFUL_EVENTS 213
-
- #define NVML_FI_DEV_NVLINK_COUNT_LOCAL_LINK_INTEGRITY_ERRORS 211
-
- #define NVML_FI_DEV_NVLINK_COUNT_MALFORMED_PACKET_ERRORS 206
-
- #define NVML_FI_DEV_NVLINK_COUNT_RAW_BER 218
-
- #define NVML_FI_DEV_NVLINK_COUNT_RAW_BER_LANE0 216
-
- #define NVML_FI_DEV_NVLINK_COUNT_RAW_BER_LANE1 217
-
- #define NVML_FI_DEV_NVLINK_COUNT_RCV_BYTES 204
-
- #define NVML_FI_DEV_NVLINK_COUNT_RCV_ERRORS 208
-
- #define NVML_FI_DEV_NVLINK_COUNT_RCV_GENERAL_ERRORS 210
-
- #define NVML_FI_DEV_NVLINK_COUNT_RCV_PACKETS 203
-
- #define NVML_FI_DEV_NVLINK_COUNT_RCV_REMOTE_ERRORS 209
-
- #define NVML_FI_DEV_NVLINK_COUNT_SYMBOL_BER 222
-
- #define NVML_FI_DEV_NVLINK_COUNT_SYMBOL_ERRORS 221
-
- #define NVML_FI_DEV_NVLINK_COUNT_VL15_DROPPED 205
-
- #define NVML_FI_DEV_NVLINK_COUNT_XMIT_BYTES 202
-
- #define NVML_FI_DEV_NVLINK_COUNT_XMIT_DISCARDS 212
-
- #define NVML_FI_DEV_NVLINK_COUNT_XMIT_PACKETS 201
-
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L0 39
-
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L1 40
-
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L10 106
-
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L11 107
-
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L2 41
-
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L3 42
-
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L4 43
-
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L5 44
-
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L6 102
-
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L7 103
-
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L8 104
-
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L9 105
-
- #define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_TOTAL 45
-
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L0 32
-
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L1 33
-
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L10 100
-
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L11 101
-
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L2 34
-
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L3 35
-
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L4 36
-
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L5 37
-
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L6 96
-
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L7 97
-
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L8 98
-
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L9 99
-
- #define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_TOTAL 38
-
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L0 148
-
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L1 149
-
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L10 158
-
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L11 159
-
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L2 150
-
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L3 151
-
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L4 152
-
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L5 153
-
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L6 154
-
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L7 155
-
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L8 156
-
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L9 157
-
- #define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_TOTAL 160
-
- #define NVML_FI_DEV_NVLINK_ERROR_DL_CRC 163
-
- #define NVML_FI_DEV_NVLINK_ERROR_DL_RECOVERY 162
-
- #define NVML_FI_DEV_NVLINK_ERROR_DL_REPLAY 161
-
- #define NVML_FI_DEV_NVLINK_GET_POWER_STATE 167
-
- #define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD 168
-
- #define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD_MAX 200
-
- #define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD_MIN 223
-
- #define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD_SUPPORTED 225
-
- #define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD_UNITS 224
-
- #define NVML_FI_DEV_NVLINK_GET_SPEED 164
-
- #define NVML_FI_DEV_NVLINK_GET_STATE 165
-
- #define NVML_FI_DEV_NVLINK_GET_VERSION 166
-
- #define NVML_FI_DEV_NVLINK_LINK_COUNT 91
-
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L0 53
-
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L1 54
-
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L10 118
-
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L11 119
-
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L2 55
-
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L3 56
-
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L4 57
-
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L5 58
-
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L6 114
-
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L7 115
-
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L8 116
-
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L9 117
-
- #define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_TOTAL 59
-
- #define NVML_FI_DEV_NVLINK_REMOTE_NVLINK_ID 146
-
远程设备 NVLink ID
链路 ID 需要在 nvmlFieldValue_t 结构体的 scopeId 字段中指定。
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L0 46
-
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L1 47
-
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L10 112
-
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L11 113
-
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L2 48
-
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L3 49
-
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L4 50
-
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L5 51
-
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L6 108
-
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L7 109
-
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L8 110
-
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L9 111
-
- #define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_TOTAL 52
-
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_COMMON 90
-
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L0 84
-
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L1 85
-
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L10 136
-
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L11 137
-
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L2 86
-
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L3 87
-
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L4 88
-
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L5 89
-
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L6 132
-
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L7 133
-
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L8 134
-
- #define NVML_FI_DEV_NVLINK_SPEED_MBPS_L9 135
-
- #define NVML_FI_DEV_NVLINK_THROUGHPUT_DATA_RX 139
-
- #define NVML_FI_DEV_NVLINK_THROUGHPUT_DATA_TX 138
-
NVLink 吞吐量计数器字段值
链路 ID 需要在 nvmlFieldValue_t 结构体的 scopeId 字段中指定。 scopeId 为 UINT_MAX 时,返回 fieldId 中指定计数器类型的所有链路的聚合值。
- #define NVML_FI_DEV_NVLINK_THROUGHPUT_RAW_RX 141
-
- #define NVML_FI_DEV_NVLINK_THROUGHPUT_RAW_TX 140
-
- #define NVML_FI_DEV_NVSWITCH_CONNECTED_LINK_COUNT 147
-
NVSwitch: 已连接的 NVLink 数量
- #define NVML_FI_DEV_PCIE_COUNT_BAD_DLLP 178
-
- #define NVML_FI_DEV_PCIE_COUNT_BAD_TLP 176
-
- #define NVML_FI_DEV_PCIE_COUNT_CORRECTABLE_ERRORS 173
-
- #define NVML_FI_DEV_PCIE_COUNT_FATAL_ERROR 180
-
- #define NVML_FI_DEV_PCIE_COUNT_LANE_ERROR 183
-
- #define NVML_FI_DEV_PCIE_COUNT_LCRC_ERROR 182
-
- #define NVML_FI_DEV_PCIE_COUNT_NAKS_RECEIVED 174
-
- #define NVML_FI_DEV_PCIE_COUNT_NAKS_SENT 177
-
- #define NVML_FI_DEV_PCIE_COUNT_NON_FATAL_ERROR 179
-
- #define NVML_FI_DEV_PCIE_COUNT_RECEIVER_ERROR 175
-
- #define NVML_FI_DEV_PCIE_COUNT_RX_BYTES 198
-
- #define NVML_FI_DEV_PCIE_COUNT_TX_BYTES 197
-
- #define NVML_FI_DEV_PCIE_COUNT_UNSUPPORTED_REQ 181
-
- #define NVML_FI_DEV_PCIE_L0_TO_RECOVERY_COUNTER 169
-
- #define NVML_FI_DEV_PCIE_REPLAY_COUNTER 94
-
- #define NVML_FI_DEV_PCIE_REPLAY_ROLLOVER_COUNTER 95
-
- #define NVML_FI_DEV_PERF_POLICY_BOARD_LIMIT 77
-
- #define NVML_FI_DEV_PERF_POLICY_LOW_UTILIZATION 78
-
- #define NVML_FI_DEV_PERF_POLICY_POWER 74
-
- #define NVML_FI_DEV_PERF_POLICY_RELIABILITY 79
-
- #define NVML_FI_DEV_PERF_POLICY_SYNC_BOOST 76
-
- #define NVML_FI_DEV_PERF_POLICY_THERMAL 75
-
- #define NVML_FI_DEV_PERF_POLICY_TOTAL_APP_CLOCKS 80
-
- #define NVML_FI_DEV_PERF_POLICY_TOTAL_BASE_CLOCKS 81
-
- #define NVML_FI_DEV_POWER_AVERAGE 185
-
以毫瓦为单位检索此 GPU 的功耗。仅当支持电源管理模式时才可用。请参阅 nvmlDeviceGetPowerManagementMode 和 nvmlDeviceGetPowerUsage。
scopeId 需要指定。它表示:0 - 仅 GPU 范围 - 检索 GPU 的指标 1 - 模块范围 - 检索模块(例如 CPU + GPU)的指标。注意:此处的 CPU 指的是 NVIDIA CPU(例如 Grace)。不支持 x86 或非 NVIDIA ARM。
- #define NVML_FI_DEV_POWER_CURRENT_LIMIT 190
-
- #define NVML_FI_DEV_POWER_DEFAULT_LIMIT 189
-
- #define NVML_FI_DEV_POWER_INSTANT 186
-
- #define NVML_FI_DEV_POWER_MAX_LIMIT 188
-
- #define NVML_FI_DEV_POWER_MIN_LIMIT 187
-
- #define NVML_FI_DEV_POWER_REQUESTED_LIMIT 192
-
- #define NVML_FI_DEV_REMAPPED_COR 142
-
- #define NVML_FI_DEV_REMAPPED_FAILURE 145
-
- #define NVML_FI_DEV_REMAPPED_PENDING 144
-
- #define NVML_FI_DEV_REMAPPED_UNC 143
-
- #define NVML_FI_DEV_RESET_STATUS 226
-
- #define NVML_FI_DEV_RETIRED_DBE 30
-
- #define NVML_FI_DEV_RETIRED_PENDING 31
-
- #define NVML_FI_DEV_RETIRED_PENDING_DBE 93
-
- #define NVML_FI_DEV_RETIRED_PENDING_SBE 92
-
- #define NVML_FI_DEV_RETIRED_SBE 29
-
- #define NVML_FI_DEV_TEMPERATURE_GPU_MAX_TLIMIT 196
-
- #define NVML_FI_DEV_TEMPERATURE_MEM_MAX_TLIMIT 195
-
- #define NVML_FI_DEV_TEMPERATURE_SHUTDOWN_TLIMIT 193
-
GPU T.Limit 温度阈值(摄氏度)
这些字段在 Ada 及更高版本架构上受支持,并取代 nvmlDeviceGetTemperatureThreshold。
- #define NVML_FI_DEV_TEMPERATURE_SLOWDOWN_TLIMIT 194
-
- #define NVML_FI_DEV_TOTAL_ENERGY_CONSUMPTION 83
-
- #define NVML_FI_MAX 269
-
- #define NVML_FI_PWR_SMOOTHING_ACTIVE_PRESET_PROFILE 264
-
- #define NVML_FI_PWR_SMOOTHING_ADMIN_OVERRIDE_PERCENT_TMP_FLOOR 265
-
- #define NVML_FI_PWR_SMOOTHING_ADMIN_OVERRIDE_RAMP_DOWN_HYST_VAL 268
-
- #define NVML_FI_PWR_SMOOTHING_ADMIN_OVERRIDE_RAMP_DOWN_RATE 267
-
- #define NVML_FI_PWR_SMOOTHING_ADMIN_OVERRIDE_RAMP_UP_RATE 266
-
- #define NVML_FI_PWR_SMOOTHING_APPLIED_TMP_CEIL 254
-
- #define NVML_FI_PWR_SMOOTHING_APPLIED_TMP_FLOOR 255
-
- #define NVML_FI_PWR_SMOOTHING_ENABLED 251
-
- #define NVML_FI_PWR_SMOOTHING_HW_CIRCUITRY_PERCENT_LIFETIME_REMAINING 258
-
- #define NVML_FI_PWR_SMOOTHING_IMM_RAMP_DOWN_ENABLED 253
-
- #define NVML_FI_PWR_SMOOTHING_MAX_NUM_PRESET_PROFILES 259
-
- #define NVML_FI_PWR_SMOOTHING_MAX_PERCENT_TMP_FLOOR_SETTING 256
-
- #define NVML_FI_PWR_SMOOTHING_MIN_PERCENT_TMP_FLOOR_SETTING 257
-
- #define NVML_FI_PWR_SMOOTHING_PRIV_LVL 252
-
- #define NVML_FI_PWR_SMOOTHING_PROFILE_PERCENT_TMP_FLOOR 260
-
- #define NVML_FI_PWR_SMOOTHING_PROFILE_RAMP_DOWN_HYST_VAL 263
-
- #define NVML_FI_PWR_SMOOTHING_PROFILE_RAMP_DOWN_RATE 262
-
- #define NVML_FI_PWR_SMOOTHING_PROFILE_RAMP_UP_RATE 261
-
- #define NVML_NVLINK_LOW_POWER_THRESHOLD_UNIT_100US 0x0
-
NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD_UNITS
- #define NVML_NVLINK_POWER_STATE_HIGH_SPEED 0x0
-
NVML_NVLINK_POWER_STATES