NVML API 参考指南 (PDF) - vR570 (更旧版本) - 最后更新于 2025年1月29日 - 发送反馈

4.3. 字段值枚举

结构体 

宏定义

#define NVML_FI_DEV_C2C_LINK_COUNT 170
设备上存在的 C2C 链接数量。
#define NVML_FI_DEV_C2C_LINK_GET_MAX_BW 172
活跃链接的 C2C 链接速度,单位为 MBps。
#define NVML_FI_DEV_C2C_LINK_GET_STATUS 171
C2C 链接状态 0=非活跃 1=活跃。
#define NVML_FI_DEV_DRAIN_AND_RESET_STATUS 227
已弃用,请勿使用(请使用 NVML_FI_DEV_GET_GPU_RECOVERY_ACTION 代替)。
#define NVML_FI_DEV_ECC_CURRENT 1
当前 ECC 模式。1=激活。0=未激活。
#define NVML_FI_DEV_ECC_DBE_AGG_CBU 28
CBU 双比特聚合 ECC 错误。
#define NVML_FI_DEV_ECC_DBE_AGG_DEV 23
设备内存双比特聚合(持久性)ECC 错误。
#define NVML_FI_DEV_ECC_DBE_AGG_L1 19
L1 缓存双比特聚合(持久性)ECC 错误。
#define NVML_FI_DEV_ECC_DBE_AGG_L2 21
L2 缓存双比特聚合(持久性)ECC 错误。
#define NVML_FI_DEV_ECC_DBE_AGG_REG 25
寄存器文件双比特聚合(持久性)ECC 错误。
#define NVML_FI_DEV_ECC_DBE_AGG_TEX 27
纹理内存双比特聚合(持久性)ECC 错误。
#define NVML_FI_DEV_ECC_DBE_AGG_TOTAL 6
总计双比特聚合(持久性)ECC 错误。
#define NVML_FI_DEV_ECC_DBE_VOL_CBU 17
CBU 双比特易失性 ECC 错误。
#define NVML_FI_DEV_ECC_DBE_VOL_DEV 12
设备内存双比特易失性 ECC 错误。
#define NVML_FI_DEV_ECC_DBE_VOL_L1 8
L1 缓存双比特易失性 ECC 错误。
#define NVML_FI_DEV_ECC_DBE_VOL_L2 10
L2 缓存双比特易失性 ECC 错误。
#define NVML_FI_DEV_ECC_DBE_VOL_REG 14
寄存器文件双比特易失性 ECC 错误。
#define NVML_FI_DEV_ECC_DBE_VOL_TEX 16
纹理内存双比特易失性 ECC 错误。
#define NVML_FI_DEV_ECC_DBE_VOL_TOTAL 4
总计双比特易失性 ECC 错误。
#define NVML_FI_DEV_ECC_PENDING 2
待定 ECC 模式。1=激活。0=未激活。
#define NVML_FI_DEV_ECC_SBE_AGG_DEV 22
设备内存单比特聚合(持久性)ECC 错误。
#define NVML_FI_DEV_ECC_SBE_AGG_L1 18
L1 缓存单比特聚合(持久性)ECC 错误。
#define NVML_FI_DEV_ECC_SBE_AGG_L2 20
L2 缓存单比特聚合(持久性)ECC 错误。
#define NVML_FI_DEV_ECC_SBE_AGG_REG 24
寄存器文件单比特聚合(持久性)ECC 错误。
#define NVML_FI_DEV_ECC_SBE_AGG_TEX 26
纹理内存单比特聚合(持久性)ECC 错误。
#define NVML_FI_DEV_ECC_SBE_AGG_TOTAL 5
总计单比特聚合(持久性)ECC 错误。
#define NVML_FI_DEV_ECC_SBE_VOL_DEV 11
设备内存单比特易失性 ECC 错误。
#define NVML_FI_DEV_ECC_SBE_VOL_L1 7
L1 缓存单比特易失性 ECC 错误。
#define NVML_FI_DEV_ECC_SBE_VOL_L2 9
L2 缓存单比特易失性 ECC 错误。
#define NVML_FI_DEV_ECC_SBE_VOL_REG 13
寄存器文件单比特易失性 ECC 错误。
#define NVML_FI_DEV_ECC_SBE_VOL_TEX 15
纹理内存单比特易失性 ECC 错误。
#define NVML_FI_DEV_ECC_SBE_VOL_TOTAL 3
总计单比特易失性 ECC 错误。
#define NVML_FI_DEV_ENERGY 191
自上次驱动程序重新加载以来,总能耗(单位为 mJ)。与 GPU 的 NVML_FI_DEV_TOTAL_ENERGY_CONSUMPTION 相同。
#define NVML_FI_DEV_GET_GPU_RECOVERY_ACTION 230
GPU 恢复操作 - 无/重置/重启/耗尽 P2P/耗尽并重置。
#define NVML_FI_DEV_IS_MIG_MODE_INDEPENDENT_MIG_QUERY_CAPABLE 199
MIG 模式独立,支持 MIG 查询的设备。1=是。0=否。
#define NVML_FI_DEV_IS_RESETLESS_MIG_SUPPORTED 184
设备的无重置 MIG 能力。
#define NVML_FI_DEV_MEMORY_TEMP 82
设备的内存温度。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L0 60
计数器集 0,通道 0 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L1 61
计数器集 0,通道 1 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L10 124
计数器集 0,通道 10 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L11 125
计数器集 0,通道 11 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L2 62
计数器集 0,通道 2 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L3 63
计数器集 0,通道 3 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L4 64
计数器集 0,通道 4 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L5 65
计数器集 0,通道 5 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L6 120
计数器集 0,通道 6 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L7 121
计数器集 0,通道 7 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L8 122
计数器集 0,通道 8 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L9 123
计数器集 0,通道 9 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_TOTAL 66
计数器集 0,所有通道的 NVLink 总带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L0 67
计数器集 1,通道 0 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L1 68
计数器集 1,通道 1 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L10 130
计数器集 1,通道 10 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L11 131
计数器集 1,通道 11 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L2 69
计数器集 1,通道 2 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L3 70
计数器集 1,通道 3 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L4 71
计数器集 1,通道 4 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L5 72
计数器集 1,通道 5 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L6 126
计数器集 1,通道 6 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L7 127
计数器集 1,通道 7 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L8 128
计数器集 1,通道 8 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L9 129
计数器集 1,通道 9 的 NVLink 带宽计数器。
#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_TOTAL 73
计数器集 1,所有通道的 NVLink 总带宽计数器。
#define NVML_FI_DEV_NVLINK_COUNT_BUFFER_OVERRUN_ERRORS 207
由于缓冲区溢出,在 Rx 上丢弃的数据包数量。
#define NVML_FI_DEV_NVLINK_COUNT_EFFECTIVE_BER 220
有效错误的有效 BER。
#define NVML_FI_DEV_NVLINK_COUNT_EFFECTIVE_ERRORS 219
每个 Nvlink 数据包中错误数量的总和。
#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_0 235
已纠正的符号错误计数 - bin 0。
#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_1 236
已纠正的符号错误计数 - bin 1。
#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_10 245
已纠正的符号错误计数 - bin 10。
#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_11 246
已纠正的符号错误计数 - bin 11。
#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_12 247
已纠正的符号错误计数 - bin 12。
#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_13 248
已纠正的符号错误计数 - bin 13。
#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_14 249
已纠正的符号错误计数 - bin 14。
#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_15 250
已纠正的符号错误计数 - bin 15。
#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_2 237
已纠正的符号错误计数 - bin 2。
#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_3 238
已纠正的符号错误计数 - bin 3。
#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_4 239
已纠正的符号错误计数 - bin 4。
#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_5 240
已纠正的符号错误计数 - bin 5。
#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_6 241
已纠正的符号错误计数 - bin 6。
#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_7 242
已纠正的符号错误计数 - bin 7。
#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_8 243
已纠正的符号错误计数 - bin 8。
#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_9 244
已纠正的符号错误计数 - bin 9。
#define NVML_FI_DEV_NVLINK_COUNT_LINK_RECOVERY_EVENTS 215
链路从“Up”状态变为恢复状态的次数,与结果无关。
#define NVML_FI_DEV_NVLINK_COUNT_LINK_RECOVERY_FAILED_EVENTS 214
链路从“Up”状态变为恢复状态,但恢复失败,并且链路被声明为“down”状态的次数。
#define NVML_FI_DEV_NVLINK_COUNT_LINK_RECOVERY_SUCCESSFUL_EVENTS 213
链路从“Up”状态变为恢复状态,但恢复成功,并且链路恢复为“up”状态的次数。
#define NVML_FI_DEV_NVLINK_COUNT_LOCAL_LINK_INTEGRITY_ERRORS 211
本地错误计数超过阈值的总次数。
#define NVML_FI_DEV_NVLINK_COUNT_MALFORMED_PACKET_ERRORS 206
在链路上接收到格式错误的数据包数量。
#define NVML_FI_DEV_NVLINK_COUNT_RAW_BER 218
已弃用,请勿使用。
#define NVML_FI_DEV_NVLINK_COUNT_RAW_BER_LANE0 216
已弃用,请勿使用。
#define NVML_FI_DEV_NVLINK_COUNT_RAW_BER_LANE1 217
已弃用,请勿使用。
#define NVML_FI_DEV_NVLINK_COUNT_RCV_BYTES 204
NVLink5 中链路上的总接收字节数。
#define NVML_FI_DEV_NVLINK_COUNT_RCV_ERRORS 208
在链路上接收到错误数据包的总数。
#define NVML_FI_DEV_NVLINK_COUNT_RCV_GENERAL_ERRORS 210
接收到具有头部不匹配的数据包总数。
#define NVML_FI_DEV_NVLINK_COUNT_RCV_PACKETS 203
NVLink5 中链路上的总接收数据包数。
#define NVML_FI_DEV_NVLINK_COUNT_RCV_REMOTE_ERRORS 209
接收到的数据包总数 - 冲突/EBP 标记。
#define NVML_FI_DEV_NVLINK_COUNT_SYMBOL_BER 222
符号错误的 BER。
#define NVML_FI_DEV_NVLINK_COUNT_SYMBOL_ERRORS 221
rx 符号中的错误数。
#define NVML_FI_DEV_NVLINK_COUNT_VL15_DROPPED 205
已弃用,请勿使用。
#define NVML_FI_DEV_NVLINK_COUNT_XMIT_BYTES 202
NVLink5 中链路上的总发送字节数。
#define NVML_FI_DEV_NVLINK_COUNT_XMIT_DISCARDS 212
丢弃的 tx 错误数据包总数。
#define NVML_FI_DEV_NVLINK_COUNT_XMIT_PACKETS 201
NVLink5 中链路上的总发送数据包数。
#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L0 39
通道 0 的 NVLink 数据 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L1 40
通道 1 的 NVLink 数据 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L10 106
通道 10 的 NVLink 数据 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L11 107
通道 11 的 NVLink 数据 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L2 41
通道 2 的 NVLink 数据 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L3 42
通道 3 的 NVLink 数据 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L4 43
通道 4 的 NVLink 数据 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L5 44
通道 5 的 NVLink 数据 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L6 102
通道 6 的 NVLink 数据 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L7 103
通道 7 的 NVLink 数据 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L8 104
通道 8 的 NVLink 数据 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L9 105
通道 9 的 NVLink 数据 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_TOTAL 45
所有通道的 NvLink 数据 CRC 错误计数器总计。
#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L0 32
通道 0 的 NVLink 流控制 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L1 33
通道 1 的 NVLink 流控制 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L10 100
通道 10 的 NVLink 流控制 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L11 101
通道 11 的 NVLink 流控制 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L2 34
通道 2 的 NVLink 流控制 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L3 35
通道 3 的 NVLink 流控制 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L4 36
通道 4 的 NVLink 流控制 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L5 37
通道 5 的 NVLink 流控制 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L6 96
通道 6 的 NVLink 流控制 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L7 97
通道 7 的 NVLink 流控制 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L8 98
通道 8 的 NVLink 流控制 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L9 99
通道 9 的 NVLink 流控制 CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_TOTAL 38
所有通道的 NVLink 流控制 CRC 错误计数器总计。
#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L0 148
链路 0 的 NVLink 数据 ECC 错误计数器。
#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L1 149
链路 1 的 NVLink 数据 ECC 错误计数器。
#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L10 158
链路 10 的 NVLink 数据 ECC 错误计数器。
#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L11 159
链路 11 的 NVLink 数据 ECC 错误计数器。
#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L2 150
链路 2 的 NVLink 数据 ECC 错误计数器。
#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L3 151
链路 3 的 NVLink 数据 ECC 错误计数器。
#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L4 152
链路 4 的 NVLink 数据 ECC 错误计数器。
#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L5 153
链路 5 的 NVLink 数据 ECC 错误计数器。
#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L6 154
链路 6 的 NVLink 数据 ECC 错误计数器。
#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L7 155
链路 7 的 NVLink 数据 ECC 错误计数器。
#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L8 156
链路 8 的 NVLink 数据 ECC 错误计数器。
#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L9 157
链路 9 的 NVLink 数据 ECC 错误计数器。
#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_TOTAL 160
所有链路的 NVLink 数据 ECC 错误计数器总计。
#define NVML_FI_DEV_NVLINK_ERROR_DL_CRC 163
NVLink CRC 错误计数器。
#define NVML_FI_DEV_NVLINK_ERROR_DL_RECOVERY 162
NVLink 恢复错误计数器。
#define NVML_FI_DEV_NVLINK_ERROR_DL_REPLAY 161
NVLink 重放错误计数器。
#define NVML_FI_DEV_NVLINK_GET_POWER_STATE 167
NVLink 电源状态。 0=高速 1=低速。
#define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD 168
NVLink 空闲周期长度(单位可以在以下位置找到)。
#define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD_MAX 200
最大 Nvlink 功耗阈值。 请参阅 NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD。
#define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD_MIN 223
最小 Nvlink 功耗阈值。 请参阅 NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD。
#define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD_SUPPORTED 225
确定是否支持 Nvlink 功耗阈值功能。
#define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD_UNITS 224
值采用 NVML_NVLINK_LOW_POWER_THRESHOLD_UNIT_* 的形式。
#define NVML_FI_DEV_NVLINK_GET_SPEED 164
NVLink 速度,单位为 MBps。
#define NVML_FI_DEV_NVLINK_GET_STATE 165
NVLink 状态 - 活动、非活动。
#define NVML_FI_DEV_NVLINK_GET_VERSION 166
NVLink 版本。
#define NVML_FI_DEV_NVLINK_LINK_COUNT 91
设备上存在的 NVLink 数量。
#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L0 53
通道 0 的 NVLink 恢复错误计数器。
#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L1 54
通道 1 的 NVLink 恢复错误计数器。
通道 10 的 NVLink 恢复错误计数器。
通道 10 的 NVLink 恢复错误计数器。
#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L11 119
通道 11 的 NVLink 恢复错误计数器。
#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L2 55
通道 2 的 NVLink 恢复错误计数器。
#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L3 56
通道 3 的 NVLink 恢复错误计数器。
#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L4 57
通道 4 的 NVLink 恢复错误计数器。
#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L5 58
通道 5 的 NVLink 恢复错误计数器。
#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L6 114
通道 6 的 NVLink 恢复错误计数器。
#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L7 115
通道 7 的 NVLink 恢复错误计数器。
#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L8 116
通道 8 的 NVLink 恢复错误计数器。
#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L9 117
通道 9 的 NVLink 恢复错误计数器。
#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_TOTAL 59
所有通道的 NVLink 恢复错误计数器总计。
#define NVML_FI_DEV_NVLINK_REMOTE_NVLINK_ID 146
远程设备 NVLink ID。
#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L0 46
通道 0 的 NVLink 重放错误计数器。
#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L1 47
通道 1 的 NVLink 重放错误计数器。
#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L10 112
通道 10 的 NVLink 重放错误计数器。
#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L11 113
通道 11 的 NVLink 重放错误计数器。
#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L2 48
通道 2 的 NVLink 重放错误计数器。
#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L3 49
通道 3 的 NVLink 重放错误计数器。
#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L4 50
通道 4 的 NVLink 重放错误计数器。
#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L5 51
通道 5 的 NVLink 重放错误计数器。
#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L6 108
通道 6 的 NVLink 重放错误计数器。
#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L7 109
通道 7 的 NVLink 重放错误计数器。
#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L8 110
通道 8 的 NVLink 重放错误计数器。
#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L9 111
通道 9 的 NVLink 重放错误计数器。
#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_TOTAL 52
所有通道的 NVLink 重放错误计数器总计。
#define NVML_FI_DEV_NVLINK_SPEED_MBPS_COMMON 90
活动链接的通用 NVLink 速度,单位为 MBps。
#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L0 84
链接 0 的 NVLink 速度,单位为 MBps。
#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L1 85
链接 1 的 NVLink 速度,单位为 MBps。
#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L10 136
链接 10 的 NVLink 速度,单位为 MBps。
#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L11 137
链接 11 的 NVLink 速度,单位为 MBps。
#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L2 86
链接 2 的 NVLink 速度,单位为 MBps。
#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L3 87
链接 3 的 NVLink 速度,单位为 MBps。
#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L4 88
链接 4 的 NVLink 速度,单位为 MBps。
#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L5 89
链接 5 的 NVLink 速度,单位为 MBps。
#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L6 132
链接 6 的 NVLink 速度,单位为 MBps。
#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L7 133
链接 7 的 NVLink 速度,单位为 MBps。
#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L8 134
链接 8 的 NVLink 速度,单位为 MBps。
#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L9 135
链接 9 的 NVLink 速度,单位为 MBps。
#define NVML_FI_DEV_NVLINK_THROUGHPUT_DATA_RX 139
NVLink 接收数据吞吐量,单位为 KiB。
#define NVML_FI_DEV_NVLINK_THROUGHPUT_DATA_TX 138
NVLink 发送数据吞吐量,单位为 KiB。
#define NVML_FI_DEV_NVLINK_THROUGHPUT_RAW_RX 141
NVLink 原始接收数据 + 协议开销,单位为 KiB。
#define NVML_FI_DEV_NVLINK_THROUGHPUT_RAW_TX 140
NVLink 原始发送数据 + 协议开销,单位为 KiB。
#define NVML_FI_DEV_NVSWITCH_CONNECTED_LINK_COUNT 147
连接到 NVSwitch 的 NVLink 数量。
#define NVML_FI_DEV_PCIE_COUNT_BAD_DLLP 178
PCIe 坏 DLLP 计数器。
#define NVML_FI_DEV_PCIE_COUNT_BAD_TLP 176
PCIe 坏 TLP 计数器。
#define NVML_FI_DEV_PCIE_COUNT_CORRECTABLE_ERRORS 173
PCIe 可纠正错误计数器。
#define NVML_FI_DEV_PCIE_COUNT_FATAL_ERROR 180
PCIe 致命错误计数器。
#define NVML_FI_DEV_PCIE_COUNT_LANE_ERROR 183
PCIe 每通道错误计数器。
#define NVML_FI_DEV_PCIE_COUNT_LCRC_ERROR 182
PCIe LCRC 错误计数器。
#define NVML_FI_DEV_PCIE_COUNT_NAKS_RECEIVED 174
PCIe NAK 接收计数器。
#define NVML_FI_DEV_PCIE_COUNT_NAKS_SENT 177
PCIe NAK 发送计数器。
#define NVML_FI_DEV_PCIE_COUNT_NON_FATAL_ERROR 179
PCIe 非致命错误计数器。
#define NVML_FI_DEV_PCIE_COUNT_RECEIVER_ERROR 175
PCIe 接收器错误计数器。
#define NVML_FI_DEV_PCIE_COUNT_RX_BYTES 198
PCIe 接收字节数。 值可能回绕。
#define NVML_FI_DEV_PCIE_COUNT_TX_BYTES 197
PCIe 发送字节数。 值可能回绕。
#define NVML_FI_DEV_PCIE_COUNT_UNSUPPORTED_REQ 181
PCIe 不支持的请求计数器。
#define NVML_FI_DEV_PCIE_L0_TO_RECOVERY_COUNTER 169
设备 PEX 错误恢复计数器。
#define NVML_FI_DEV_PCIE_REPLAY_COUNTER 94
PCIe 重放计数器。
#define NVML_FI_DEV_PCIE_REPLAY_ROLLOVER_COUNTER 95
PCIe 重放翻转计数器。
#define NVML_FI_DEV_PERF_POLICY_BOARD_LIMIT 77
板级限制的性能策略计数器。
#define NVML_FI_DEV_PERF_POLICY_LOW_UTILIZATION 78
低 GPU 利用率策略的性能策略计数器。
#define NVML_FI_DEV_PERF_POLICY_POWER 74
功耗策略的性能策略计数器。
#define NVML_FI_DEV_PERF_POLICY_RELIABILITY 79
可靠性策略的性能策略计数器。
#define NVML_FI_DEV_PERF_POLICY_SYNC_BOOST 76
同步加速策略的性能策略计数器。
#define NVML_FI_DEV_PERF_POLICY_THERMAL 75
散热策略的性能策略计数器。
#define NVML_FI_DEV_PERF_POLICY_TOTAL_APP_CLOCKS 80
总应用时钟策略的性能策略计数器。
#define NVML_FI_DEV_PERF_POLICY_TOTAL_BASE_CLOCKS 81
总基本时钟策略的性能策略计数器。
#define NVML_FI_DEV_POWER_AVERAGE 185
GPU 功耗 1 秒间隔平均值,在 Ampere(GA100 除外)或更新的架构上受支持。
#define NVML_FI_DEV_POWER_CURRENT_LIMIT 190
当前强制执行的限制,单位为毫瓦(包括在其他地方设置的其他限制,例如带外)。
#define NVML_FI_DEV_POWER_DEFAULT_LIMIT 189
默认功耗限制,单位为毫瓦(设备启动时的限制)。
#define NVML_FI_DEV_POWER_INSTANT 186
当前 GPU 功耗,在所有架构上均受支持。
#define NVML_FI_DEV_POWER_MAX_LIMIT 188
最大功耗限制,单位为毫瓦。
#define NVML_FI_DEV_POWER_MIN_LIMIT 187
最小功耗限制,单位为毫瓦。
#define NVML_FI_DEV_POWER_REQUESTED_LIMIT 192
由 NVML 或任何其他用户空间客户端请求的功耗限制。
#define NVML_FI_DEV_REMAPPED_COR 142
由于可纠正错误而重新映射的行数。
#define NVML_FI_DEV_REMAPPED_FAILURE 145
是否有任何行重新映射失败 1=是 0=否。
#define NVML_FI_DEV_REMAPPED_PENDING 144
是否有任何行正在等待重新映射。 1=是 0=否。
#define NVML_FI_DEV_REMAPPED_UNC 143
由于不可纠正错误而重新映射的行数。
#define NVML_FI_DEV_RESET_STATUS 226
已弃用,请勿使用(请改用 NVML_FI_DEV_GET_GPU_RECOVERY_ACTION)。
#define NVML_FI_DEV_RETIRED_DBE 30
由于双位错误而停用的页面数量。
#define NVML_FI_DEV_RETIRED_PENDING 31
是否有任何页面正在等待停用。 1=是。 0=否。
#define NVML_FI_DEV_RETIRED_PENDING_DBE 93
是否有任何页面因 DBE 而正在等待停用。 1=是。 0=否。
#define NVML_FI_DEV_RETIRED_PENDING_SBE 92
是否有任何页面因 SBE 而正在等待停用。 1=是。 0=否。
#define NVML_FI_DEV_RETIRED_SBE 29
由于单位错误而停用的页面数量。
#define NVML_FI_DEV_TEMPERATURE_GPU_MAX_TLIMIT 196
T.Limit 温度,超过此温度 GPU 可能会被限制到基本时钟以下。
#define NVML_FI_DEV_TEMPERATURE_MEM_MAX_TLIMIT 195
T.Limit 温度,超过此温度 GPU 可能会因内存温度开始 SW 减速。
#define NVML_FI_DEV_TEMPERATURE_SHUTDOWN_TLIMIT 193
T.Limit 温度,超过此温度 GPU 可能会因硬件保护而关闭。
#define NVML_FI_DEV_TEMPERATURE_SLOWDOWN_TLIMIT 194
T.Limit 温度,超过此温度 GPU 可能会开始硬件减速。
#define NVML_FI_DEV_TOTAL_ENERGY_CONSUMPTION 83
自上次重新加载驱动程序以来 GPU 的总能耗,单位为 mJ。
#define NVML_FI_MAX 269
比上面定义的最大字段 ID 大一。
#define NVML_FI_PWR_SMOOTHING_ACTIVE_PRESET_PROFILE 264
活动预设配置文件编号。
#define NVML_FI_PWR_SMOOTHING_ADMIN_OVERRIDE_PERCENT_TMP_FLOOR 265
给定配置文件的 % TMP 下限值
#define NVML_FI_PWR_SMOOTHING_ADMIN_OVERRIDE_RAMP_DOWN_HYST_VAL 268
给定配置文件的 ramp down 滞后值,单位为 ms。
#define NVML_FI_PWR_SMOOTHING_ADMIN_OVERRIDE_RAMP_DOWN_RATE 267
给定配置文件的 ramp down 速率,单位为 mW/s。
#define NVML_FI_PWR_SMOOTHING_ADMIN_OVERRIDE_RAMP_UP_RATE 266
给定配置文件的 ramp up 速率,单位为 mW/s。
#define NVML_FI_PWR_SMOOTHING_APPLIED_TMP_CEIL 254
应用的 TMP 上限值,单位为瓦特。
#define NVML_FI_PWR_SMOOTHING_APPLIED_TMP_FLOOR 255
应用的 TMP 下限值,单位为瓦特。
#define NVML_FI_PWR_SMOOTHING_ENABLED 251
启用状态 (0/禁用或 1/启用)。
#define NVML_FI_PWR_SMOOTHING_HW_CIRCUITRY_PERCENT_LIFETIME_REMAINING 258
硬件电路 % 剩余寿命。
#define NVML_FI_PWR_SMOOTHING_IMM_RAMP_DOWN_ENABLED 253
立即 ramp down 启用状态 (0/禁用或 1/启用)。
#define NVML_FI_PWR_SMOOTHING_MAX_NUM_PRESET_PROFILES 259
预设配置文件的最大数量。
#define NVML_FI_PWR_SMOOTHING_MAX_PERCENT_TMP_FLOOR_SETTING 256
最大 % TMP 下限值。
#define NVML_FI_PWR_SMOOTHING_MIN_PERCENT_TMP_FLOOR_SETTING 257
最小 % TMP 下限值。
#define NVML_FI_PWR_SMOOTHING_PRIV_LVL 252
当前权限级别。
#define NVML_FI_PWR_SMOOTHING_PROFILE_PERCENT_TMP_FLOOR 260
给定配置文件的 % TMP 下限值
#define NVML_FI_PWR_SMOOTHING_PROFILE_RAMP_DOWN_HYST_VAL 263
给定配置文件的 ramp down 滞后值,单位为 ms。
#define NVML_FI_PWR_SMOOTHING_PROFILE_RAMP_DOWN_RATE 262
给定配置文件的 ramp down 速率,单位为 mW/s。
#define NVML_FI_PWR_SMOOTHING_PROFILE_RAMP_UP_RATE 261
给定配置文件的 ramp up 速率,单位为 mW/s。
#define NVML_NVLINK_LOW_POWER_THRESHOLD_UNIT_100US 0x0
#define NVML_NVLINK_POWER_STATE_HIGH_SPEED 0x0

宏定义

#define NVML_FI_DEV_C2C_LINK_COUNT 170

#define NVML_FI_DEV_C2C_LINK_GET_MAX_BW 172

#define NVML_FI_DEV_C2C_LINK_GET_STATUS 171

#define NVML_FI_DEV_DRAIN_AND_RESET_STATUS 227

#define NVML_FI_DEV_ECC_CURRENT 1

字段标识符。

所有标识符都与设备有关。每个 ID 仅使用一次,并保证永远不会更改。

#define NVML_FI_DEV_ECC_DBE_AGG_CBU 28

#define NVML_FI_DEV_ECC_DBE_AGG_DEV 23

#define NVML_FI_DEV_ECC_DBE_AGG_L1 19

#define NVML_FI_DEV_ECC_DBE_AGG_L2 21

#define NVML_FI_DEV_ECC_DBE_AGG_REG 25

#define NVML_FI_DEV_ECC_DBE_AGG_TEX 27

#define NVML_FI_DEV_ECC_DBE_AGG_TOTAL 6

#define NVML_FI_DEV_ECC_DBE_VOL_CBU 17

#define NVML_FI_DEV_ECC_DBE_VOL_DEV 12

#define NVML_FI_DEV_ECC_DBE_VOL_L1 8

#define NVML_FI_DEV_ECC_DBE_VOL_L2 10

#define NVML_FI_DEV_ECC_DBE_VOL_REG 14

#define NVML_FI_DEV_ECC_DBE_VOL_TEX 16

#define NVML_FI_DEV_ECC_DBE_VOL_TOTAL 4

#define NVML_FI_DEV_ECC_PENDING 2

#define NVML_FI_DEV_ECC_SBE_AGG_DEV 22

#define NVML_FI_DEV_ECC_SBE_AGG_L1 18

#define NVML_FI_DEV_ECC_SBE_AGG_L2 20

#define NVML_FI_DEV_ECC_SBE_AGG_REG 24

#define NVML_FI_DEV_ECC_SBE_AGG_TEX 26

#define NVML_FI_DEV_ECC_SBE_AGG_TOTAL 5

#define NVML_FI_DEV_ECC_SBE_VOL_DEV 11

#define NVML_FI_DEV_ECC_SBE_VOL_L1 7

#define NVML_FI_DEV_ECC_SBE_VOL_L2 9

#define NVML_FI_DEV_ECC_SBE_VOL_REG 13

#define NVML_FI_DEV_ECC_SBE_VOL_TEX 15

#define NVML_FI_DEV_ECC_SBE_VOL_TOTAL 3

#define NVML_FI_DEV_ENERGY 191

#define NVML_FI_DEV_GET_GPU_RECOVERY_ACTION 230

#define NVML_FI_DEV_IS_MIG_MODE_INDEPENDENT_MIG_QUERY_CAPABLE 199

#define NVML_FI_DEV_IS_RESETLESS_MIG_SUPPORTED 184

#define NVML_FI_DEV_MEMORY_TEMP 82

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L0 60

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L1 61

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L10 124

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L11 125

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L2 62

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L3 63

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L4 64

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L5 65

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L6 120

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L7 121

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L8 122

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_L9 123

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C0_TOTAL 66

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L0 67

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L1 68

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L10 130

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L11 131

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L2 69

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L3 70

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L4 71

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L5 72

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L6 126

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L7 127

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L8 128

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_L9 129

#define NVML_FI_DEV_NVLINK_BANDWIDTH_C1_TOTAL 73

#define NVML_FI_DEV_NVLINK_COUNT_BUFFER_OVERRUN_ERRORS 207

#define NVML_FI_DEV_NVLINK_COUNT_EFFECTIVE_BER 220

#define NVML_FI_DEV_NVLINK_COUNT_EFFECTIVE_ERRORS 219

#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_0 235

#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_1 236

#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_10 245

#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_11 246

#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_12 247

#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_13 248

#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_14 249

#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_15 250

#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_2 237

#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_3 238

#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_4 239

#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_5 240

#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_6 241

#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_7 242

#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_8 243

#define NVML_FI_DEV_NVLINK_COUNT_FEC_HISTORY_9 244

#define NVML_FI_DEV_NVLINK_COUNT_LINK_RECOVERY_EVENTS 215

#define NVML_FI_DEV_NVLINK_COUNT_LINK_RECOVERY_FAILED_EVENTS 214

#define NVML_FI_DEV_NVLINK_COUNT_LINK_RECOVERY_SUCCESSFUL_EVENTS 213

#define NVML_FI_DEV_NVLINK_COUNT_LOCAL_LINK_INTEGRITY_ERRORS 211

#define NVML_FI_DEV_NVLINK_COUNT_MALFORMED_PACKET_ERRORS 206

#define NVML_FI_DEV_NVLINK_COUNT_RAW_BER 218

#define NVML_FI_DEV_NVLINK_COUNT_RAW_BER_LANE0 216

#define NVML_FI_DEV_NVLINK_COUNT_RAW_BER_LANE1 217

#define NVML_FI_DEV_NVLINK_COUNT_RCV_BYTES 204

#define NVML_FI_DEV_NVLINK_COUNT_RCV_ERRORS 208

#define NVML_FI_DEV_NVLINK_COUNT_RCV_GENERAL_ERRORS 210

#define NVML_FI_DEV_NVLINK_COUNT_RCV_PACKETS 203

#define NVML_FI_DEV_NVLINK_COUNT_RCV_REMOTE_ERRORS 209

#define NVML_FI_DEV_NVLINK_COUNT_SYMBOL_BER 222

#define NVML_FI_DEV_NVLINK_COUNT_SYMBOL_ERRORS 221

#define NVML_FI_DEV_NVLINK_COUNT_VL15_DROPPED 205

#define NVML_FI_DEV_NVLINK_COUNT_XMIT_BYTES 202

#define NVML_FI_DEV_NVLINK_COUNT_XMIT_DISCARDS 212

#define NVML_FI_DEV_NVLINK_COUNT_XMIT_PACKETS 201

#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L0 39

#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L1 40

#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L10 106

#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L11 107

#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L2 41

#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L3 42

#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L4 43

#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L5 44

#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L6 102

#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L7 103

#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L8 104

#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_L9 105

#define NVML_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_TOTAL 45

#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L0 32

#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L1 33

#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L10 100

#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L11 101

#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L2 34

#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L3 35

#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L4 36

#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L5 37

#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L6 96

#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L7 97

#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L8 98

#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_L9 99

#define NVML_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_TOTAL 38

#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L0 148

#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L1 149

#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L10 158

#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L11 159

#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L2 150

#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L3 151

#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L4 152

#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L5 153

#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L6 154

#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L7 155

#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L8 156

#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_L9 157

#define NVML_FI_DEV_NVLINK_ECC_DATA_ERROR_COUNT_TOTAL 160

#define NVML_FI_DEV_NVLINK_ERROR_DL_CRC 163

#define NVML_FI_DEV_NVLINK_ERROR_DL_RECOVERY 162

#define NVML_FI_DEV_NVLINK_ERROR_DL_REPLAY 161

#define NVML_FI_DEV_NVLINK_GET_POWER_STATE 167

#define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD 168

#define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD_MAX 200

#define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD_MIN 223

#define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD_SUPPORTED 225

#define NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD_UNITS 224

#define NVML_FI_DEV_NVLINK_GET_SPEED 164

#define NVML_FI_DEV_NVLINK_GET_STATE 165

#define NVML_FI_DEV_NVLINK_GET_VERSION 166

#define NVML_FI_DEV_NVLINK_LINK_COUNT 91

#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L0 53

#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L1 54

#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L10 118

#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L11 119

#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L2 55

#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L3 56

#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L4 57

#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L5 58

#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L6 114

#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L7 115

#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L8 116

#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_L9 117

#define NVML_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_TOTAL 59

#define NVML_FI_DEV_NVLINK_REMOTE_NVLINK_ID 146

远程设备 NVLink ID

链路 ID 需要在 nvmlFieldValue_t 结构体的 scopeId 字段中指定。

#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L0 46

#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L1 47

#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L10 112

#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L11 113

#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L2 48

#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L3 49

#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L4 50

#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L5 51

#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L6 108

#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L7 109

#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L8 110

#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_L9 111

#define NVML_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_TOTAL 52

#define NVML_FI_DEV_NVLINK_SPEED_MBPS_COMMON 90

#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L0 84

#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L1 85

#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L10 136

#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L11 137

#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L2 86

#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L3 87

#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L4 88

#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L5 89

#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L6 132

#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L7 133

#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L8 134

#define NVML_FI_DEV_NVLINK_SPEED_MBPS_L9 135

#define NVML_FI_DEV_NVLINK_THROUGHPUT_DATA_RX 139

#define NVML_FI_DEV_NVLINK_THROUGHPUT_DATA_TX 138

NVLink 吞吐量计数器字段值

链路 ID 需要在 nvmlFieldValue_t 结构体的 scopeId 字段中指定。 scopeId 为 UINT_MAX 时,返回 fieldId 中指定计数器类型的所有链路的聚合值。

#define NVML_FI_DEV_NVLINK_THROUGHPUT_RAW_RX 141

#define NVML_FI_DEV_NVLINK_THROUGHPUT_RAW_TX 140

#define NVML_FI_DEV_NVSWITCH_CONNECTED_LINK_COUNT 147

NVSwitch: 已连接的 NVLink 数量

#define NVML_FI_DEV_PCIE_COUNT_BAD_DLLP 178

#define NVML_FI_DEV_PCIE_COUNT_BAD_TLP 176

#define NVML_FI_DEV_PCIE_COUNT_CORRECTABLE_ERRORS 173

#define NVML_FI_DEV_PCIE_COUNT_FATAL_ERROR 180

#define NVML_FI_DEV_PCIE_COUNT_LANE_ERROR 183

#define NVML_FI_DEV_PCIE_COUNT_LCRC_ERROR 182

#define NVML_FI_DEV_PCIE_COUNT_NAKS_RECEIVED 174

#define NVML_FI_DEV_PCIE_COUNT_NAKS_SENT 177

#define NVML_FI_DEV_PCIE_COUNT_NON_FATAL_ERROR 179

#define NVML_FI_DEV_PCIE_COUNT_RECEIVER_ERROR 175

#define NVML_FI_DEV_PCIE_COUNT_RX_BYTES 198

#define NVML_FI_DEV_PCIE_COUNT_TX_BYTES 197

#define NVML_FI_DEV_PCIE_COUNT_UNSUPPORTED_REQ 181

#define NVML_FI_DEV_PCIE_L0_TO_RECOVERY_COUNTER 169

#define NVML_FI_DEV_PCIE_REPLAY_COUNTER 94

#define NVML_FI_DEV_PCIE_REPLAY_ROLLOVER_COUNTER 95

#define NVML_FI_DEV_PERF_POLICY_BOARD_LIMIT 77

#define NVML_FI_DEV_PERF_POLICY_LOW_UTILIZATION 78

#define NVML_FI_DEV_PERF_POLICY_POWER 74

#define NVML_FI_DEV_PERF_POLICY_RELIABILITY 79

#define NVML_FI_DEV_PERF_POLICY_SYNC_BOOST 76

#define NVML_FI_DEV_PERF_POLICY_THERMAL 75

#define NVML_FI_DEV_PERF_POLICY_TOTAL_APP_CLOCKS 80

#define NVML_FI_DEV_PERF_POLICY_TOTAL_BASE_CLOCKS 81

#define NVML_FI_DEV_POWER_AVERAGE 185

以毫瓦为单位检索此 GPU 的功耗。仅当支持电源管理模式时才可用。请参阅 nvmlDeviceGetPowerManagementModenvmlDeviceGetPowerUsage

scopeId 需要指定。它表示:0 - 仅 GPU 范围 - 检索 GPU 的指标 1 - 模块范围 - 检索模块(例如 CPU + GPU)的指标。注意:此处的 CPU 指的是 NVIDIA CPU(例如 Grace)。不支持 x86 或非 NVIDIA ARM。

#define NVML_FI_DEV_POWER_CURRENT_LIMIT 190

#define NVML_FI_DEV_POWER_DEFAULT_LIMIT 189

#define NVML_FI_DEV_POWER_INSTANT 186

#define NVML_FI_DEV_POWER_MAX_LIMIT 188

#define NVML_FI_DEV_POWER_MIN_LIMIT 187

#define NVML_FI_DEV_POWER_REQUESTED_LIMIT 192

#define NVML_FI_DEV_REMAPPED_COR 142

#define NVML_FI_DEV_REMAPPED_FAILURE 145

#define NVML_FI_DEV_REMAPPED_PENDING 144

#define NVML_FI_DEV_REMAPPED_UNC 143

#define NVML_FI_DEV_RESET_STATUS 226

#define NVML_FI_DEV_RETIRED_DBE 30

#define NVML_FI_DEV_RETIRED_PENDING 31

#define NVML_FI_DEV_RETIRED_PENDING_DBE 93

#define NVML_FI_DEV_RETIRED_PENDING_SBE 92

#define NVML_FI_DEV_RETIRED_SBE 29

#define NVML_FI_DEV_TEMPERATURE_GPU_MAX_TLIMIT 196

#define NVML_FI_DEV_TEMPERATURE_MEM_MAX_TLIMIT 195

#define NVML_FI_DEV_TEMPERATURE_SHUTDOWN_TLIMIT 193

GPU T.Limit 温度阈值(摄氏度)

这些字段在 Ada 及更高版本架构上受支持,并取代 nvmlDeviceGetTemperatureThreshold

#define NVML_FI_DEV_TEMPERATURE_SLOWDOWN_TLIMIT 194

#define NVML_FI_DEV_TOTAL_ENERGY_CONSUMPTION 83

#define NVML_FI_MAX 269

#define NVML_FI_PWR_SMOOTHING_ACTIVE_PRESET_PROFILE 264

#define NVML_FI_PWR_SMOOTHING_ADMIN_OVERRIDE_PERCENT_TMP_FLOOR 265

#define NVML_FI_PWR_SMOOTHING_ADMIN_OVERRIDE_RAMP_DOWN_HYST_VAL 268

#define NVML_FI_PWR_SMOOTHING_ADMIN_OVERRIDE_RAMP_DOWN_RATE 267

#define NVML_FI_PWR_SMOOTHING_ADMIN_OVERRIDE_RAMP_UP_RATE 266

#define NVML_FI_PWR_SMOOTHING_APPLIED_TMP_CEIL 254

#define NVML_FI_PWR_SMOOTHING_APPLIED_TMP_FLOOR 255

#define NVML_FI_PWR_SMOOTHING_ENABLED 251

#define NVML_FI_PWR_SMOOTHING_HW_CIRCUITRY_PERCENT_LIFETIME_REMAINING 258

#define NVML_FI_PWR_SMOOTHING_IMM_RAMP_DOWN_ENABLED 253

#define NVML_FI_PWR_SMOOTHING_MAX_NUM_PRESET_PROFILES 259

#define NVML_FI_PWR_SMOOTHING_MAX_PERCENT_TMP_FLOOR_SETTING 256

#define NVML_FI_PWR_SMOOTHING_MIN_PERCENT_TMP_FLOOR_SETTING 257

#define NVML_FI_PWR_SMOOTHING_PRIV_LVL 252

#define NVML_FI_PWR_SMOOTHING_PROFILE_PERCENT_TMP_FLOOR 260

#define NVML_FI_PWR_SMOOTHING_PROFILE_RAMP_DOWN_HYST_VAL 263

#define NVML_FI_PWR_SMOOTHING_PROFILE_RAMP_DOWN_RATE 262

#define NVML_FI_PWR_SMOOTHING_PROFILE_RAMP_UP_RATE 261

#define NVML_NVLINK_LOW_POWER_THRESHOLD_UNIT_100US 0x0

NVML_FI_DEV_NVLINK_GET_POWER_THRESHOLD_UNITS

#define NVML_NVLINK_POWER_STATE_HIGH_SPEED 0x0

NVML_NVLINK_POWER_STATES


NVML API 参考指南 (PDF) - vR570 (更旧版本) - 最后更新于 2025年1月29日 - 发送反馈