lsf系统查看程序显存占用情况(超算)

目前只知道需要3条命令查看显存,如果哪位大佬知道只要一条命令就可以,欢迎指点。

好,开始正文。

查看程序占用的显存主要分为三步:

  • 找到自己的进程id
  • 根据id找到那台服务器(结点),服务器(结点)上会记录第几块卡
  • 根据服务器结点和卡的编号查看显存占用

举个例子:

  1. 找到自己的进程id
bjobs -w

可以看出进程号是:58170

2. 根据id找到那台服务器(结点),服务器(结点)上会记录第几块卡

bjobs -l 58170

找到 r1cmpsrvs79-14ig0602:gpus=3。其中”r1cmpsrvs79-14ig0602“代表结点编号;“gpus=3”代表3号卡

3.最后一步。根据服务器结点和卡的编号查看显存占用

lsload -gpuload -w r1cmpsrvs79-14ig0602

找到3号卡,可以看出一共用了27.5G的显存。

猜你喜欢

转载自blog.csdn.net/Answer3664/article/details/107639693