【环境搭建】 测试gpu的bandwidth;p2p的bandwidth测试;以及使用DeepBench测试conv、矩阵乘法的运算能力

【环境搭建】 测试gpu的bandwidth;p2p的bandwidth测试;以及使用DeepBench测试conv、矩阵乘法的运算能力

测试gpu的bandwidth

利用安装好的cuda里面的samples,测试GPU的显存带宽

cd /usr/local/cuda/samples/1_Utilities/bandwidthTest
sudo make
//编译后会在当前文件夹下生成一个名为“bandwidthTest”的可执行文件
./bandwidthTest

我的测试结果
图1

测试p2p的bandwidth

如果有两块gpu,可以利用安装好的cuda里面的samples测试p2p的GPU显存带宽

cd /usr/local/cuda/samples/1_Utilities/p2pBandwidthLatencyTest
sudo make
//编译后会在当前文件夹下生成一个名为“p2pBandwidthLatencyTest”的可执行文件
./p2pBandwidthLatencyTest

我的测试结果
图2

使用DeepBench测试conv、矩阵乘法的运算能力

cat /usr/local/cuda/version.txt
//查看cuda版本
git clone https://github.com/baidu-research/DeepBench

使用DeepBench测试conv、矩阵乘法的运算能力,必须安装cudnn
cuDNN的全称为NVIDIA CUDA® Deep Neural Network library,是NVIDIA专门针对深度神经网络(Deep Neural Networks)中的基础操作而设计基于GPU的加速库

cudnn版本和cuda版本是有对应关系的
下载对应版本的cudnn
图3
我的是cuda 9.0,所以我下载的包是对应的cudnn-9.0-linux-x64-v7.4.1.5.tgz

tar -zxvf cudnn-9.0-linux-x64-v7.4.1.5.tgz
//解压压缩文件

解压后会生成一个名为cuda的文件夹

//cd 到解压的这个cuda文件夹中的include文件夹中,里面有cudnn.h文件
sudo cp cudnn.h /usr/local/cuda/include
sudo chmod a+r /usr/local/cuda/include/cudnn.h
//给cudnn.h添加权限
//cd 到解压的这个cuda文件夹中的lib64文件夹中,里面有libcudnn.so,libcudnn.so.7,libcudnn.so.7.4.1等文件文件
sudo cp lib* /usr/local/cuda/lib64
//*是正则,lib开头的都拷贝
cd /usr/local/cuda/lib64
sudo rm -rf libcudnn.so libcudnn.so.7 
//删除原有动态文件
sudo ln -s libcudnn.so.7.4.1 libcudnn.so.7 
//生成软衔接
sudo ln -s libcudnn.so.7 libcudnn.so 
//生成软链接

到这里cudnn安装完成
除了cudnn,还要安装其他库,下面依次列举

  1. nccl
git clone https://github.com/NVIDIA/nccl.git
cd nccl
sudo make install
sudo ldconfig
  1. mpich
    http://www.mpich.org/downloads/下载mpich源码
    图4
tar -zxvf mpich-3.3.tar.gz
cd mpich-3.3
./configure
sudo make
sudo make install

以上安装过程完成后,就可以使用DeepBench测试conv、矩阵乘法的运算能力了

cd /DeepBench/code/nvidia
sudo make
//sudo make 后面有很多参数,具体见DeepBench的github主页
//编译之后还要用export配置一下lib文件夹的位置,具体见DeepBench的github主页

//会生成一个“bin”文件夹,里面是不同测试内容的可执行文件
//直接执行这些可执行文件就可以测试不同的内容了

结语

如果您有修改意见或问题,欢迎留言或者通过邮箱和我联系。
手打很辛苦,如果我的文章对您有帮助,转载请注明出处。

猜你喜欢

转载自blog.csdn.net/Zhang_Chen_/article/details/90021977
今日推荐