解决Mask RCNN训练时GPU内存溢出问题

首先自己是个小白对于如何使用GPU跑程序这个学习了一下:

(1)使用的是putty,安装了Anaconda这个IDE环境,用的conda install tensorflow-gpu安装的GPU版本tf,之前只是安装了tf并没有选择GPU版本。安装完GPU版本的tf,可以进入python环境导入import tensorflow as tf 进行测试一下,如果没有报错即为成功。

(2)并在自己Train.ipynb代码中添加   import os

                                                              os.environ["CUDA_DEVICE_ORDER"]="PCI_BUS_ID"

                                                              os.environ["CUDA_VISIBLE_DEVICES"]="0"

即可调用GPU运行。

(3)由于自己的图片量太大,就报错大致意思是内存溢出。

用top命令查看GPU进程,发现自己开了好多没关占用内存量,所以重启了一下服务器,

并将一部分参数进行修改将IMAGE_MIN_DIM分别调小一倍。STEPS_PER_EPOCH=1    VALIDATION_STEPS=1  即可进行重新训练。

猜你喜欢

转载自blog.csdn.net/m0_37957160/article/details/82757780
今日推荐