Linux:nvidia-smi简介
本文简介一下nvidia-smi命令下的结果(当然它还可以支持更多复杂命令,这里不对其进行介绍)
下面的表格就是显示谁在使用GPU,使用程度为多少
(比如图中就是“lee"用户在跑python程序,导致我的程序出现:RuntimeError: CUDA error: out of memory)
上面的表格中:
- Fan: 风扇转速(0~100%);首先这个转速是期望转速,并不能直接反应实际情况;另外有些通过其他设备降温的GPU不会返回转速
- Temp: 摄氏温度~
- Perf: 性能状态(P0~P12,P0最大性能状态)
- Pwr: 能耗~
- Persistence-M,这个是持续模式状态(OFF/ON),可以加快GPU启动速度,但是能耗大
- Bus-Id: GPU总线信息~
- Disp-A: Display Active,表示GPU的显示是否初始化~
- Memory-Usage: 显存使用率~
- Volatile GPU-Util: GPU利用率~
- 最后两个是ECC和计算模式~
另外,科普一下显存利用率和GPU利用率的区别:
- 显卡是由GPU计算单元和显存组成的,他俩的关系类似于CPU和内存的关系~
- 显存用于存放数据、模型等,所以显存越大能运行的网络也越大~
- 而计算单元类似于GPU中的核,用来进行数值计算;其计算能力越大,自然速度越快
- 更多内容可以看这里:链接