Linux:nvidia-smi简介

本文简介一下nvidia-smi命令下的结果(当然它还可以支持更多复杂命令,这里不对其进行介绍)
Linux:nvidia-smi简介
下面的表格就是显示谁在使用GPU,使用程度为多少
(比如图中就是“lee"用户在跑python程序,导致我的程序出现:RuntimeError: CUDA error: out of memory)

上面的表格中:

  • Fan: 风扇转速(0~100%);首先这个转速是期望转速,并不能直接反应实际情况;另外有些通过其他设备降温的GPU不会返回转速
  • Temp: 摄氏温度~
  • Perf: 性能状态(P0~P12,P0最大性能状态)
  • Pwr: 能耗~
  • Persistence-M,这个是持续模式状态(OFF/ON),可以加快GPU启动速度,但是能耗大
  • Bus-Id: GPU总线信息~
  • Disp-A: Display Active,表示GPU的显示是否初始化~
  • Memory-Usage: 显存使用率~
  • Volatile GPU-Util: GPU利用率~
  • 最后两个是ECC和计算模式~

另外,科普一下显存利用率GPU利用率的区别:

  • 显卡是由GPU计算单元和显存组成的,他俩的关系类似于CPU和内存的关系~
  • 显存用于存放数据、模型等,所以显存越大能运行的网络也越大~
  • 而计算单元类似于GPU中的核,用来进行数值计算;其计算能力越大,自然速度越快
  • 更多内容可以看这里:链接