服务器内存泄漏

在集群上跑程序的时候,明明是100G的内存,却总是被kill掉,因为OOM

这就很奇怪,后来查了一下,原因是内存泄漏了

内存泄漏(Memory Leak)是指程序中已动态分配的堆内存由于某种原因程序未释放或无法释放,造成系统内存的浪费,导致程序运行速度减慢甚至系统崩溃等严重后果

就是程序停止了之后(经常是被ctrl+c手动终止),其占用的内存并没有释放。通常是因为代码写的烂,mmlab的框架在清GPU显存和防止内存泄漏方面做的很差

而且对于linux kernel,只要不断电就不会释放内存

所以如果内存泄漏积累到一定程度了,就只能重启

Guess you like

Origin blog.csdn.net/hxxjxw/article/details/120671269