详细模式#
NVPL BLAS 可以被指示打印关于每个接口函数调用的信息,包括传递的参数(输出与函数签名对齐)以及运行所需的时间。在这种情况下,库还会一次性打印关于其运行系统的的信息。当启用详细模式时,库会将信息打印到 stdout
。每行都以 NVPL_BLAS_VERBOSE:
开头。
要使用详细模式,请设置环境变量
export NVPL_BLAS_VERBOSE=1
详细模式输出示例
NVPL_BLAS_VERBOSE: NVPL BLAS version 0.1.0
NVPL_BLAS_VERBOSE: Platform: Neoverse V2, cores:72 sve_width:128. Cache: L1:64 KB (cl:64 ways:4 sets:256) L2:1024 KB (cl:64 ways:8 sets:2048) L3:122880 KB (cl:64 ways:12 sets:163840)
NVPL_BLAS_VERBOSE: dgemm_(N,N,128,256,123,2,0xfffdddb62000,128,0xfffdddb12000,123,-1,0xfffdddac2000,128) time_us:4742 int:lp64 max_nthr:72 tid:fffdddeb0020
NVPL_BLAS_VERBOSE: cscal_(1024,0xaaab41ed69e0,0xaaab41ee5000,1) time_us:5.76 int:lp64 max_nthr:72 tid:fffdddeb0020
警告
详细模式具有不可忽略的性能影响。