服务器连接断开 显存未释放
1、用nvidia-smi也好,top也好都找不到kill掉的进程了,但是显存仍然占用没有被释放,怎么办呢?毕竟top也找不到进程号呀
用以下指令查找出top没有而他有的进程
fuser -v /dev/nvidia*
逐个kill掉top中不显示的进程就可以了
2、pytorch杀不干净
ps aux|grep lk|grep python|awk '{print $2}'|xargs kill
3、更加暴力的方法是直接删除该用户的所有的进程
killall -u usrname