linux服务器精确kill掉占用某几张卡的显存的程序

ps aux | grep python
或
ps aux | grep open-mmdetection

这里可以明显的看到local_rank=0和=1的两个程序就是占用我0卡和1卡的程序,果断kill -9杀掉就可以了

这里还可以甄别其他程序,像tensorboard,multiprocessing semaphore_tracker, multiprocessing spawn

后两个明显是DDP多卡训练的一些监控进程

Guess you like

Origin blog.csdn.net/hxxjxw/article/details/120764706