在Ubuntu18.04下安装NVIDIA-drver、CUDA、CUDNN、Tensorflow-gpu随笔 (不是教程)

在Ubuntu18.04下安装NVIDIA-drver、CUDA、CUDNN、Tensorflow-gpu随笔 (不是教程)

我的配置和安装版本

  • GPU:TITAN
  • Ubuntu18.04内核:Linux 5.4.0-52-generic
  • NVIDIA-driver: 从官网下载历史版本的run文件,版本号450.66(安装最新的450.80.02没法成功安装,nvidia-smi显示Failed,用了之前学长使用的版本450.66)
  • CUDA :10
  • CUDNN:对应CUDA的 忘记了
  • Tensorflow-gpu:1.13.1

基本步骤及坑位提示

  • 首先安装nvidia-driver,
    • 坑槽1:版本 这里用ubuntu-drivers devices推荐的driver,并没有很准很好用,不推荐apt-get直接安装nvidia-driver-***了 就算是对应的450版本 我安了很多遍也完全没有跑通。所以还是官网下载run文件然后sudo sh *.run
    • 坑槽2:GCC 跟了一个教程提前把gcc从本来的7.5降级到6.5,说是用6跑会稍出错。真的拜托。最后千辛万苦升回7.5,因450.66版本标准用7.4跑,不过ignore之后也没什么问题。所以我的理解就是没必要碰gcc版本,除非有什么报错再说。
    • 坑槽3:驱动冲突 请一定一定一定一定一定要跟网上其他教程禁用掉nouvea驱动,真的,我后来安装完重启就黑屏进不去桌面了,无限紫屏。我这里解决办法是进recovery模式切到上一个内核然后把新内核删掉。。。所以内核也请顺手sudo apt-mark hold住,不要让ubuntu自动更新内核,很容易有错。
    • 坑槽4: 安装选项 安装过程中问你kernel什么model要不要,就选不要。谢谢。我选要就会failed。其他的 32兼容 可要可不要 我的建议就是不要,少安装少出错。安了也用不到。
    • 一般情况下,版本选的好,安装就很顺利。安装不顺利,跟版本号有很大关系,建议nvidia-smi fail的同学直接换版本号安装,最后选择了学长之前的环境的版本号,直接安装好了。所以就不是越新越好,这东西跟手机不一样,就用前人测试过能跑通的版本,平平淡淡最好。
  • 其次安装cuda和cudnn
    这里我安装都超顺利,没什么槽。安装cuda的时候不要再选安装driver了。出错了之前的努力全都泡汤。
  • 最后安装tensorflow-gpu==1.13.1
    • 写到这里,有点累了,就说下需要注意的几个地方啊。我用的是miniconda安装的环境,最后因为base也pip,miniconda也pip,还出了不少问题,所以不要乱pip install,python的版本也注意清楚。我这里因为项目的关系用的python3.6,但是默认2系列的2.7,总会莫名其妙装2里面,所以pip就全都用pip3。不然之后代码就容易出错,是因为numpy在各种环境下装太多次,系统不知道乱掉的原因。
    • serial和pyserial这类比较像的包,千万别module缺什么就安装什么。多搜索下确定好要安装什么比较好。例如PyCRC,在pip里安装pythoncrc。
    • 这次安装花了一整天,各种报错还是请善用搜索工具,切记不要复制一行粘贴一行,搞清楚问题定位,直接药到病除比乱投医强太多。
    • 我安装pyqt5也出了一箩筐破坑,不过有各种大大探讨,还是可以慢慢解决。

猜你喜欢

转载自blog.csdn.net/qq_34029469/article/details/109273849