在Ubuntu18.04下安装NVIDIA-drver、CUDA、CUDNN、Tensorflow-gpu随笔 (不是教程)
企业开发
2023-12-17 10:15:25
阅读次数: 0
在Ubuntu18.04下安装NVIDIA-drver、CUDA、CUDNN、Tensorflow-gpu随笔 (不是教程)
我的配置和安装版本
- GPU:TITAN
- Ubuntu18.04内核:Linux 5.4.0-52-generic
- NVIDIA-driver: 从官网下载历史版本的run文件,版本号450.66(安装最新的450.80.02没法成功安装,nvidia-smi显示Failed,用了之前学长使用的版本450.66)
- CUDA :10
- CUDNN:对应CUDA的 忘记了
- Tensorflow-gpu:1.13.1
基本步骤及坑位提示
- 首先安装nvidia-driver,
- 坑槽1:版本 这里用ubuntu-drivers devices推荐的driver,并没有很准很好用,不推荐apt-get直接安装nvidia-driver-***了 就算是对应的450版本 我安了很多遍也完全没有跑通。所以还是官网下载run文件然后sudo sh *.run
- 坑槽2:GCC 跟了一个教程提前把gcc从本来的7.5降级到6.5,说是用6跑会稍出错。真的拜托。最后千辛万苦升回7.5,因450.66版本标准用7.4跑,不过ignore之后也没什么问题。所以我的理解就是没必要碰gcc版本,除非有什么报错再说。
- 坑槽3:驱动冲突 请一定一定一定一定一定要跟网上其他教程禁用掉nouvea驱动,真的,我后来安装完重启就黑屏进不去桌面了,无限紫屏。我这里解决办法是进recovery模式切到上一个内核然后把新内核删掉。。。所以内核也请顺手sudo apt-mark hold住,不要让ubuntu自动更新内核,很容易有错。
- 坑槽4: 安装选项 安装过程中问你kernel什么model要不要,就选不要。谢谢。我选要就会failed。其他的 32兼容 可要可不要 我的建议就是不要,少安装少出错。安了也用不到。
- 一般情况下,版本选的好,安装就很顺利。安装不顺利,跟版本号有很大关系,建议nvidia-smi fail的同学直接换版本号安装,最后选择了学长之前的环境的版本号,直接安装好了。所以就不是越新越好,这东西跟手机不一样,就用前人测试过能跑通的版本,平平淡淡最好。
- 其次安装cuda和cudnn
这里我安装都超顺利,没什么槽。安装cuda的时候不要再选安装driver了。出错了之前的努力全都泡汤。
- 最后安装tensorflow-gpu==1.13.1
- 写到这里,有点累了,就说下需要注意的几个地方啊。我用的是miniconda安装的环境,最后因为base也pip,miniconda也pip,还出了不少问题,所以不要乱pip install,python的版本也注意清楚。我这里因为项目的关系用的python3.6,但是默认2系列的2.7,总会莫名其妙装2里面,所以pip就全都用pip3。不然之后代码就容易出错,是因为numpy在各种环境下装太多次,系统不知道乱掉的原因。
- serial和pyserial这类比较像的包,千万别module缺什么就安装什么。多搜索下确定好要安装什么比较好。例如PyCRC,在pip里安装pythoncrc。
- 这次安装花了一整天,各种报错还是请善用搜索工具,切记不要复制一行粘贴一行,搞清楚问题定位,直接药到病除比乱投医强太多。
- 我安装pyqt5也出了一箩筐破坑,不过有各种大大探讨,还是可以慢慢解决。
转载自blog.csdn.net/qq_34029469/article/details/109273849