实验室新进购的服务器。
机型为:4卡GPU,GTX2080ti。
新的服务器需要对其进行压力测试,测试服务器在显存满载的情况下,能否保证散热正常、计算精度正常等等。
本次压力测试,用到的程序gpu_burn实现,搜索了很长时间的资料,记录下来。
首先在gpu_burn官网下载代码
官网链接:点击进入gpu_burn官网
这里我下载的是gpu_burn-0.9.tar.gz (compute profile 30, compatible w/ CUDA 9) 。
wget http://wili.cc/blog/entries/gpu-burn/gpu_burn-0.9.tar.gz
然后对文件进行解压(tar -zxvf filename)
进入gpu_burn文件内:
cd gpu_burn
编译文件:
make
进行压力测试:
sh gpu_burn
上边的是一个10秒的测试,如果要进行1小时的测试只需要在后面加秒数即可:
sh gpu_burn 3600
另外,如果要运行很长时间,需要放在后台运行,需要用到nohup命令:
nohup sh gpu_burn 3600
后台运行时,cmd输出的内容会存入到nohup.out文件内,文件过于庞大,这里我们只查看最后5行信息,即可看见运行的最后结果:
tail -n 5 filename
也可以观察显卡的占用情况:
watch nvidia-smi