Ubuntu16,Nvidia安装总结

ubuntu本身拥有开源的集成显卡驱动程序nouveau,先屏蔽nouveau,再安装NVIDIA官方驱动。 
查看属性
ls -lh /etc/modprobe.d/blacklist.conf

查看是否屏蔽了nouveau(命令没有输出就行)
lsmod | grep nouveau

查看GPU型号
lspci | grep -i nvidia

查看nvidia驱动版本
dpkg --list | grep nvidia-*

卸载原有的nvidia驱动
apt-get remove --purge nvidia*

下载nvidia官方驱动文件,安装nvidia驱动
./NVIDIA-Linux-x86_64-390.77.run -no-opengl-files -no-nouveau-check -no-x-check
./NVIDIA-Linux-x86_64-390.77.run -no-opengl-files

cudn安装(相关补丁类似)
cd /data/bigData/nvidia_driver_390.77 -- 自己的个人安装文件目录
chmod +x ./cuda_9.0.176_384.81_linux.run
sh ./cuda_9.0.176_384.81_linux.run


cudnn安装(假定cudn已经安装在/usr/local/cuda/目录下)

cp cudnn-9.0-linux-x64-v7.solitairetheme8  cudnn-9.0-linux-x64-v7.tgz
tar -xvf cudnn-9.0-linux-x64-v7.tgz  //解压结果位于当前目录的cuda目录下

在解压的目录下(当前目录的cuda目录):
cp cuda/include/*.h /usr/local/cuda/include/
cp cuda/lib64/lib* /usr/local/cuda/lib64/

(以下的3步在重新安装cudnn时可以省略)
chmod +r libcudnn.so.7.0.5
ln -s libcudnn.so.7.0.5 libcudnn.so.7
ln -s libcudnn.so.7 libcudnn.so
ldconfig -- 立刻生效动态链接库

Note:
ldconfig是一个动态链接库管理命令,实现动态链接库的系统共享。

禁止ubutnu系统自动更新
less /etc/apt/apt.conf.d/10periodic
 

检查系统内核版本

uname -sr

遇到的几个问题

1)安装nvidia驱动之后,输入nvidia-smi,没有输出显卡的相关信息

解决方案:重新安装nvidia驱动,中间有一步提示“是否restart x”,选择“yes”

2)"Would you like to register the kernel module sources with DKMS?This will allow DKMS to auomatically build a new module,if you install a different kernel later"问题:

选择 NO!

3)“Loaded runtime CuDNN library: 7101 (compatibility version 7100)”的cudnn版本问题:

解决方案:重新安装cudnn,需要在官网下载对应的v7.0的驱动(笔者安装的7.04),可以解决问题

4)频繁的调用和暂停显卡,比如频繁使用nvidia-smi,会导致rpa-**问题

解决方案:未找到解决方法,查阅资料说可能是显卡本身的硬件问题。

猜你喜欢

转载自blog.csdn.net/qm5132/article/details/82896324