本来 以为是很简单很开心的安装,花费了好几个小时,气到吐血。下面描述自己遇到的各种bug。希望能对你有帮助。
1、按照网上教材(其实基本都是翻译官方文档)安装遇到第一个问题:ubantu 命令行(tty)界面不支持中文,导致找不到存放cuda run file的目录(文件夹:下载):
解决方法:命令行修改语言
打开终端,在终端中输入命令:
export LANG=en_US
xdg-user-dirs-gtk-update
跳出对话框询问是否将目录转化为英文路径,同意并关闭。
在终端中输入命令:
export LANG=zh_CN
重新启动系统,系统会提示更新文件名称,选择不再提示,并取消修改(不再修改回中文文件夹目录)
2、cuda安装步骤参见:cuda安装
如果按照博主的(看看官方文档更好)就安装好了,那你是真的好运。ps:我的学长和我同样的实验室标配电脑:x86_64 ubantu14.04,gtx745显卡(NVIDIA显示不支持cuda但实际上可以),cpu i7-7700。
他就成功了我就失败了,服气吧!
我所遇到的第二个问题也是一个很难解决的bug:
在进入命令行界面(ctrl+Alt+f1):sudo sh cuda_...._.run之后开始安装。
我在安装时出现安装失败:installer unable to locate kernel source....
网上贼多解决方法,眼花缭乱很多还是骗人的
我用的方法很简单:
sudo apt install dkms
然后重新sudo sh cuda_...._.run安装即可。
3、最后在/dev中查看是否出现三个NVIDIA开头的文件,点背的我果然没有,参考简书。
如官方文档所说,运行官方的bash脚本,手动添加三个NVIDIA开头的文件,点背的我,又出现bash脚本没有办法运行:can't insert ‘nvidia’,key value unavailable...
简书提到了类似的bug,但其解决方案没法见效。
如果你也遇到了,博主我在挣扎之后选择重装操作系统,换到了16.04LTS,然后参考这里。
我就成功了。(但是有一步很关键,原文并没有提到,在安装NVIDIA驱动时可能会要求你disable security boot,(这个需要在开机时按F2进入BIOS或者一个叫什么的新的类似BIOS的系统去disable)这个东西不disable,reboot之后也无法然NVIDIA驱动启动)
反过来我怀疑自己之前在14.04上一直没法/dev中出现三个NVIDIA开头的文件,可能没有也是disable security boot。有兴趣的可以试试。
4、重装系统后使用anaconda装TensorFlow,装我直接装TensorFlow-gpu,所以都是直接在gpu跑,这个版本的tensorFlow根本不能在cpu上跑。不过that‘s not a problem.
我以前就装好了anaconda,直接使用,不明白道理,现在发现anaconda-navigator很有用,以及,anaconda其实是conda(环境管理器)中默认的一个环境,当你新建一个环境时,这个环境接受conda的管理,但是没有anaconda集成的各个包(如numpy、scipy..etc),需要的话,应该自行添加,可以使用anaconda-navigator来添加和管理。