linux系统个人用户安装CUDA(可切换版本)

linux系统个人用户安装CUDA,服务器初始cuda为11.6,自己安装一个cuda10.0。


前言

linux系统个人用户安装CUDA,服务器初始cuda为11.6,自己安装一个cuda10.0(以支持tensorflow1);后续如需切换版本可通过修改配置文件实现。

安装流程借鉴:https://blog.csdn.net/hizengbiao/article/details/88625044


一、cuda版本与tensorflow版本

按需选择即可,我这里主要是想用tf1,所以选择了1.15的版本

版本对应相关细节可以看一下下面这位大佬的博客
https://blog.csdn.net/weixin_44560088/article/details/117457619

二、配置步骤

下载cuda与cuDNN

首先,cd 切换到自己的路径下,然后下载文件,也可以把已经下载好的文件上传进来
wget下载代码如下:

wget -c wget -c https://developer.nvidia.com/compute/cuda/10.0/Prod/local_installers/cuda_10.0.130_410.48_linux

安装cuda

  1. sh安装cuda
sh cuda_10.0.130_410.48_linux --override

–override 是防止gcc版本不必配的问题,下面有我第一次的没加时的报错

  1. 阅读协议,内容有很多,按q退出。
  2. 相关配置,按需设置一下就行
    是否同意协议?accept
    安装不信任的软件?
    是否接受协议?
    是否安装?
Do you accept the previously read EULA?
accept/decline/quit: accept

You are attempting to install on an unsupported configuration. Do you wish to continue?
(y)es/(n)o [ default is no ]: y

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 410.48?
(y)es/(n)o/(q)uit: n

Install the CUDA 10.0 Toolkit?
(y)es/(n)o/(q)uit: y

Enter Toolkit Location
 [ default is /usr/local/cuda-10.0 ]: /home/thy/cuda-10.0/

Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: n

Install the CUDA 10.0 Samples?
(y)es/(n)o/(q)uit: /home/thy/cuda-10.0/samples/
Install the CUDA 10.0 Samples?
(y)es/(n)o/(q)uit: y

Enter CUDA Samples Location
 [ default is /home/thy ]: /home/thy/cuda-10.0/samples/

安装完成之后的代码
在这里插入图片描述

错误示例:

Error: unsupported compiler: 9.4.0. Use --override to override this check.
Missing recommended library: libGLU.so
Missing recommended library: libXi.so
Missing recommended library: libXmu.so

Error: cannot find Toolkit in /home/thy/cuda-10.0

===========
= Summary =
===========

Driver:   Not Selected
Toolkit:  Installation Failed. Using unsupported Compiler.
Samples:  Cannot find Toolkit in /home/thy/cuda-10.0

配置cuDNN

  1. 官网下载对应版本的cuDNN
  2. 创建tem文件夹,以存放解压后的文件
  3. 解压cuDNN
  4. 配置到cuda-10.0文件夹下
mkdir /home/thy/programs/tem
tar -xzvf /home/thy/programs/cudnn-10.0-linux-x64-v7.6.4.38.tgz -C /home/thy/programs/tem/
cp /home/thy/programs/tem/cuda/include/cudnn.h  /home/thy/cuda-10.0/include/  
cp /home/thy/programs/tem/cuda/lib64/libcudnn*  /home/thy/cuda-10.0/lib64
chmod a+r /home/thy/cuda-10.0/include/cudnn.h  /home/thy/cuda-10.0/lib64/libcudnn*

就tar解压完有一些提示,后几行执行完并没有反馈。如果报错了大概率路径写错了,hhh

20220810补充
cuDNN官网下载这部分可以参考一下另一篇博客,对应下载linux版本即可。也可以先下载到本地再传到服务器上
https://blog.csdn.net/qq_37386752/article/details/123720250

配置环境变量

  1. 编辑个人的环境变量
vi ~/.bashrc
  1. 添加以下几行代码
export PATH=/home/thy/cuda-10.0/bin${
    
    PATH:+:${
    
    PATH}}
export LD_LIBRARY_PATH=/home/thy/cuda-10.0/lib64${
    
    LD_LIBRARY_PATH:+:${
    
    LD_LIBRARY_PATH}}

注意保存并退出

  1. 更新环境变量
source ~/.bashrc
  1. 检验
nvcc -V

在这里插入图片描述
查看nvcc位置

which nvcc

在这里插入图片描述

切换版本

修改上面的环境变量文件即可,加载不同的文件夹,刷新即可


总结

这里我原始的cuda是11的,即本机的cuda版本,个人用户直接继承的。但是按我的方法安完之后,个人用户下的cuda路径已改为10.0,即使把环境变量文件内对应的修改部分隐去,也没能自动恢复11.6版本的CUDA。所以这是个遗留问题,不过如果以后用到了,可以根据上述方法再配置一下所需版本。

猜你喜欢

转载自blog.csdn.net/qq_37386752/article/details/124180597