解决Mask RCNN训练时GPU内存溢出问题
首先自己是个小白对于如何使用GPU跑程序这个学习了一下:
(1)使用的是putty,安装了Anaconda这个IDE环境,用的conda install tensorflow-gpu安装的GPU版本tf,之前只是安装了tf并没有选择GPU版本。安装完GPU版本的tf,可以进入python环境导入import tensorflow as tf 进行测试一下,如果没有报错即为成功。
(2)并在自己Train.ipynb代码中添加 import os
os.environ["CUDA_DEVICE_ORDER"]="PCI_BUS_ID"
os.environ["CUDA_VISIBLE_DEVICES"]="0"
即可调用GPU运行。
(3)由于自己的图片量太大,就报错大致意思是内存溢出。
用top命令查看GPU进程,发现自己开了好多没关占用内存量,所以重启了一下服务器,
并将一部分参数进行修改将IMAGE_MIN_DIM分别调小一倍。STEPS_PER_EPOCH=1 VALIDATION_STEPS=1 即可进行重新训练。