ubuntu16.04cuda10.0卸载、安装、查看版本信息

一、Ubuntu16.04查看CUDA和CUDNN版本

1、cuda一般安装在 /usr/local/cuda/ 路径下,该路径下有一个version.txt文档,里面记录了cuda的版本信息

cat /usr/local/cuda/version.txt 即可查询

二、Ubuntu16.04下安装CUDA

1.显卡驱动的安装
首先安装ubuntu系统就不做详细介绍了,默认是系统安装完成。
在安装cuda之前,第一步现在ubuntu16.04上安装NVIDIA的驱动,这里要注意:cuda版本要和驱动相对应、cuda版本要和驱动相对应、cuda版本要和驱动相对应(强调三遍)

CUDA Toolkit Version Linux x86_64 Driver Version
CUDA 10.1 >= 418.39
CUDA 10.0 >= 410.48
CUDA 9.2 >= 396.37
CUDA 9.1 >= 390.46
CUDA 9.0 >= 384.81
CUDA 8.0 >= 375.26
CUDA 7.5 >= 352.31
CUDA 7.0 >= 346.46
以上表格就是对应cuda和nvidia驱动版本之间的匹配,需要注意的是驱动的>=指的是大于这个版本的驱动,言下之意就是高版本驱动可以兼容安装低版本的cuda,反之则不成立。
ubuntu 16.04默认安装了第三方开源的驱动程序nouveau,安装nvidia显卡驱动首先需要禁用nouveau,不然会碰到冲突的问题,导致无法安装nvidia显卡驱动。

编辑文件blacklist.conf

sudo vim /etc/modprobe.d/blacklist.conf

按字母‘i’进入编辑状态
在文件最后部分插入以下两行内容

blacklist nouveau

options nouveau modeset=0

然后按‘Esc’,再按 shift+z z 键就可以保存内容并退出。或者输入 :wq! (冒号也要敲进去,加感叹号是指强制保存)
重启reboot

2、Ctrl+Alt+F1进入命令行界面

(5)停用图形界面,卸载所有显卡驱动

首先停掉图形界面,验证是否nouveau启用,没用显示即表示没有启用。

最后啊,一定要卸载所有驱动nvidia* ,不管是你自己安装的驱动,还是带着驱动。还是统统卸载吧。我第一安装的时候就没有停用自己的nvidia驱动,虽然不是nouveau驱动,但是,GPU设备和Linux内核不通信。以下是相关指令

sudo service lightdm stop
lsmod | grep nouveau
sudo apt-get remove --purge nvidia*

(6)安装cuda 10.1

注意事项:整个系统最好是英文系统,因为切换至纯命令行界面,有可能出现乱码,或者不显示。

1、找到你下载的 cuda_10.1.168_418.67_linux.run ,一般位于Download文件夹内

2、运行安装包,默认安装模式。去掉 --silent 即可自己选择按照内容。

sudo sh cuda_10.1.168_418.67_linux.run  --silent 

然后发现安装失败,并且出现循环登录,分辨率下降,真的是个大坑!!!!!!!!!!!!!!!!!!

1.问题描述

给ubuntu16.04装cuda10后,重启电脑,出现电脑无法登录帐号打状况,输入用户名密码,按enter后,黑屏然后又回到登录界面。

2.解决办法

a.在ubuntu登录界面按ctrl+alt+F1,进入ubuntu命令行界面,输入用户名,回车,输入密码,回车。

b.输入sudo vi /etc/profile,打开profile文件,删除环境变量配置语句,输入wq保存退出。输入sudo reboot重启系统。

此处又是一个大坑,循环登录不用卸载nvidia,把配置改回来就行。如果上面那个删除环境变量的方式不行,就用下面这个方法。

c-卸载.run文件安装的驱动,在NVIDIA驱动所在的目录,运行如下命令:

sudo ./NVIDIA-Linux-x86_64-xxx.run --uninstall

注:xxx是自己的版本号,可以登电脑搜一下自己的之前的安装包,这样就能查出来自己之前安装的是啥版本了
d-此时,重启可login normally.
e-驱动重新安装:

(1)Ctrl+Alt+F1
(2)sudo service lightdm stop
(3)sudo ./NVIDIA-Linux-x86_64-381.22.run -no-x-check -no-nouveau-check -no-opengl-files

安装过程选项为:

在NVIDIA驱动安装过程中,依次的选项为:
1
accept
2 The distribution-provided pre-install script failed … …
Continue installation
3 Would you like to run the nvidia-xconfig utility to automatically update your X Configuration file so set the NVIDIA X driver will be used when you restart X?
NO
4 Install 32-Bit compatibility libraries?
NO

-no-x-check安装驱动时关闭x服务;
-no-nouveau-check 安装驱动时禁用Nouveau
-no-opengl-files 安装时只装驱动文件,不安装Opengl

f-sudo service lightdm restart(可正常登录)
g-重启不会出现循环登录。
参考:http://www.th7.cn/system/lin/201702/204709.shtml
google: ubuntu get stuck in a login loop nvidia.
在Ubuntu16.04下安装CUDA的过程并不简单,小白即使看着官方文档也很容易出错,比如说安装CUDA8.0(在线安装)时,对着文档一步步安装下来都没有问题,在最后一条指令执行时:

sudo apt-get install cuda

你可能会猛然发现终端上显示安装的愕然都是CUDA10.0(也就是最新版本),等到安装结束,你再仔细一看,还确实是安装了10.0。于是就开始抓头自问“不对呀,我明明是照着文档安装下来的呀,怎么就变成10.0的了?!”
原来是安装CUDA的时候,版本自动帮你替换成了最新版(该怎么说呢?!!真是谢谢您了lol)。
解决办法,在上面那条指令后面加上版本号,完整指令就是(以安装CUDA8.0为例子):

sudo apt-get install cuda-8.0
正式安装教程:
参考博客:https://blog.csdn.net/lihe4151021/article/details/90237681
2) 重启电脑,进入登录界面的时候,不要登录进入桌面(否则可能会失败,若不小心进入,请重启电脑),直接按Ctrl+Alt+F1进入文本模式(命令行界面),登录账户。

  1. 输入 $ sudo service lightdm stop 关闭图形化界面

  2. 切换到cuda安装文件的路径:$ cd Home/

运行$ sudo sh cuda.run
在这里插入图片描述
在这里插入图片描述
首先会显示用户许可证信息,按空格键直至进度条显示到100%
然后按照提示一步步操作accept-n(driver,此前已安装过驱动)-y-y-y

  1. 输入 $ sudo service lightdm start 重新启动图形化界面。

同时按住Alt + ctrl +F7,返回到图形化登录界面,输入密码登录。

如果能够成功登录,则表示不会遇到循环登录的问题,基本说明CUDA的安装成功了。

环境配置:

添加完环境变量,重启后出现了循环登录

进入文本模式:CTRL+ALT+F1
然后发现所有命令都不好使了,包括sudo, root ,su。提示内容是:
‘/usr/bin’ is not included in the PATH
sudo: command not found

解决方案如下:

参考链接:
https://www.cnblogs.com/austinspark-jessylu/p/6737877.html
很人性化的是,系统会提示我们要使用的指令存放的正确位置,比如使用clear时提示的:Command ‘clear’ is available in ‘/usr/bin/clear’。clear命令是存放在’/usr/bin’目录下的。

要编辑/etc/profile,正常情况下使用的命令是:sudo vim /etc/profile

现在,系统找不到sudo 命令,也找不到vim命令,所以只能人工指定它们的绝对路径了。sudo 和 vim 都是存放在’/usr/bin’目录下的,所以sudo和vim的绝对路径分别是:/usr/bin/sudo /usr/bin/vim

因此要编辑/etc/profile要使用的命令应该这样写: /usr/bin/sudo /usr/bin/vim /etc/profile

只需要把自己之前添加的内容删除掉就可以了(最好是能修改成正确的,搞不定也要至少恢复原状吧),然后保存重启系统。

正常状态下重启使用:sudo reboot

当然现在也不行,要使用 /usr/bin/sudo /sbin/reboot

2.正确添加环境变量方法

参考博客:https://blog.csdn.net/j879159541/article/details/93590342
home文件下 ctrl+H显示隐藏文件 打开 .bashrc文件

sudo gedit ~/.bashrc

在最后添加

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.0/lib64
export PATH=$PATH:/usr/local/cuda-10.0/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.0

source ~/.bashrc 保存操作
再重启一下
nvcc --version 检查cuda是否安装成功

三、Ubuntu16.04下卸载CUDA

打开终端,输入以下指令

sudo apt-get remove cuda

sudo apt autoremove

sudo apt-get remove cuda*

然后将终端运行目录切换到/usr/local/下

cd /usr/local/

输入dir指令:

dir

可能会看到一个"cuda"或者“cuda-10.0”文件夹,再或者两者都有。
输入指令删除残留的文件夹(以下指令以删除“cuda-10.0”文件夹为例)

sudo rm -r cuda-10.0
参考原文:https://blog.csdn.net/qq_41381395/article/details/86775470

注:遇到的bug有以下几个t
解决Ignoring file ******** in directory ‘/etc/apt/sources.list.d/’

sudo rm /etc/apt/sources.list.d/********

发布了34 篇原创文章 · 获赞 4 · 访问量 3047

猜你喜欢

转载自blog.csdn.net/qq_41558173/article/details/96447300
今日推荐