【环境搭建】 在ubuntu上安装nvidiaGPU驱动和cuda

【环境搭建】 在ubuntu上安装nvidiaGPU驱动和cuda

安装过程

图1
这是我手动安装nvidia显卡驱动成功后的软件和更新界面,在手动安装前只不要选择使用"NVIDIA binary driver"这个选项让系统自动安装,会出现图形界面循环登录的情况。可以用ctrl+alt+F4(我的是F4,网上有人说是F0,就从F0往后按,总有一个是对的)进入命令行界面,然后删除系动自动安装的驱动,就可以重新进入图形界面。

sudo apt-get updata
sudo apt-get install --reinstall ubuntu-desktop
sudo apt-get install unity
sudo apt-get remove --purge nvidia*
shutdown -r now

重新进入图形界面后,尝试手动安装:

sudo chmod 666 /etc/modprobe.d/blacklist.conf
//给blacklist.conf可读可写权限
//二进制100,就是4,是可读权限
//二进制110,就是6,是可读可写权限
//二进制111,就是7,是可读可写可执行权限
sudo vim /etc/modprobe.d/blacklist.conf
//在文件最后添加:
blacklist nouveau
options nouveau modeset=0
sudo update-initramfs -u
//更新系统

然后要重新启动电脑

lsmod | grep nouveau
//如果没有信息显示,说明nouveau已经被禁用

https://www.nvidia.cn/下载对应自己显卡型号的驱动,下载的是一个.run的驱动。

如何查看自己电脑的显卡型号呢?

lspci | grep -i nvidia

图
将最后的十六进制序号(我这里是1c8c)输入到The PCI ID Repository,可以查询显卡型号
在这里插入图片描述
tu
驱动和显卡型号不对应会导致循环登录

将这个驱动放在home路径下,这个操作只是方便待会进入命令行操作后这个文件容易找。
ctrl+alt+F4(我的是F4,网上有人说是F0,就从F0往后按,总有一个是对的)进入命令行界面,然后:

sudo service lightdm stop
//关掉图形界面
sudo chmod  a+x NVIDIA-Linux-x86_64-430.26.run
//给.run文件可执行权限
sudo ./NVIDIA-Linux-x86_64-430.26.run -no-x-check -no-nouveau-check -no-opengl-files

进入安装界面后,基本都是选择默认选项,一路enter
安装完成后,回到命令行界面,然后:

modprobe nvidia
//挂载nvidia驱动
nvidia-smi
//查看GPU信息,正常显示则安装成功
sudo service lightdm start
//回到图形界面

接下来,安装cuda和cudnn,cudnn的安装过程在【环境搭建】 测试gpu的bandwidth;p2p的bandwidth测试;以及使用DeepBench测试conv、矩阵乘法的运算能力中有介绍。
https://developer.nvidia.com/cuda-toolkit-archive下载cuda的安装包
图2

sudo chmod  a+x cuda_10.0.130_410.48_linux.run
sudo ./cuda_10.0.130_410.48_linux.run
Do you accept the previously read EULA?
accept

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 410.48?
n

Install the CUDA 10.0 Toolkit?
y

Enter Toolkit Location
按提示的默认的填进去

Do you want to install a symbolic link at /usr/local/cuda?
y

Install the CUDA 10.0 Samples?
y

Enter CUDA Samples Location
测试用的程序,怕麻烦以后忘了这个是什么就和上一个路径填同一个

等待安装完成
填加环境变量,和之前一样,在.bash_profile中添加(在.bashrc中添加source .bash_profile,这样就不用每次执行source .bash_profile了

#cuda
export LD_LIBRARY_PATH="/usr/local/cuda-10.0/lib64":$LD_LIBRARY_PATH
export PATH="/usr/local/cuda-10.0/bin":$PATH
export CUDA_HOME="/usr/local/cuda-10.0":$CUDA_HOME
//具体路径还要看你上面的选择
nvcc --version
//查看cuda版本,如果对应安装的版本,则安装成功

安装cuda成功

程序“nvcc”尚未安装。 您可以使用以下命令安装:
sudo apt install nvidia-cuda-toolkit

千万不要执行

sudo apt install nvidia-cuda-toolkit

这会安装另一个cuda,导致循环登录问题
检查环境变量配置路径是否有问题,PATH的路径下是有nvcc的可执行文件的

结语

如果您有修改意见或问题,欢迎留言或者通过邮箱和我联系。
手打很辛苦,如果我的文章对您有帮助,转载请注明出处。

猜你喜欢

转载自blog.csdn.net/Zhang_Chen_/article/details/91796240