【Ubuntu 20.04安装和深度学习环境搭建 4090显卡】

Ubuntu安装步骤参考文章 知乎:Ubuntu 20.04系统安装及初始配置

一. 制作启动盘

1.1 下载镜像文件

先在Ubuntu官网下载系统镜像(或直接bing搜索对应版本)。【Ubuntu官网】

1.2 制作启动盘

参考这篇文章 https://blog.csdn.net/qq_21386397/article/details/129894803

  1. 需要准备一个U盘(使用之前将U盘中内容做好备份,做成启动盘后U盘内文件将被清空!)
  2. 去rufus官网或其他网站下载软件,用于将上一步下载好的镜像文件写入U盘。
    官网: rufus官网
    更多版本下载:其他版本
    github:在github下载

    无需安装,下载后可直接使用
  3. 制作启动盘

二. 安装系统

2.1 启动计算机并进入BIOS

根据自己电脑主板确认如何进入BIOS,我的是按F2或DEL进入。
插入制作好的启动盘后开机,然后快速按F2进入BIOS后,选择启动盘启动。

2.2 开始安装

(安装时忘记截图,从别人的教程里引用一些图片)

  1. 成功启动后,会进入安装引导界面,选择语言,然后点击Install Ubuntu
    安装Ubuntu

  2. 接下来选择键盘布局,然后继续
    选择键盘布局

  3. 选择网络
    在这里插入图片描述

    这一步可以选择不连接网络,连接网络后会在安装时多下载一些东西,导致安装的慢些。

  4. 选择普通安装(normal installation)
    在这里插入图片描述

  5. 安装方式

    这一步有多种选择:可以如图选择安装,会自动分配各种分区并安装;也可以选择下面的Somthing else,手动分区。如果一之前安装过系统,他还会有另外的选项,如【按照原有系统分区,覆盖安装】和【与原有系统共存】

    在这里插入图片描述

    下面具体说一下选择Something else手动分区的方案:

    我安装的这台主机的硬盘是2T的,出于以前的习惯,我只分了efi、/boot、/、/home这几个必要的分区,具体如下表

    分区名称 选择分区 文件系统类型 空间大小 描述
    efi系统分区 逻辑分区 XXX 2G efi是UEFI引导,它的作用和boot引导分区一样,但是boot引导默认grub引导。其容量给2048MB足够
    /boot 逻辑分区 ext4 1G左右 引导分区,给固态硬盘的1G=1024MB
    / 逻辑分区 ext4 200G固态硬盘 安装系统和软件,即除挂载home以外的全部都放在这里,因此空间不能太小
    /home 逻辑分区 ext4 2T固态硬盘所有内存 用于存储数据和各类文件夹,视频等和下载内容等,相当于个人文件夹,建议分配稍微大一些
  6. 选择时区

    分区后会稍微等待一段时间,之后出现如下画面,选择所在时区即可

    在这里插入图片描述

  7. 输入用户信息

    在这里插入图片描述

    输入你的名字、计算机名、用户名、用户密码。其中计算机名和用户名不建议取太长,否则后面在使用系统时,偶尔需要用到用户名或计算机名的场景会很麻烦(输很长的名字)。

  8. 等待安装完成

    在这里插入图片描述

  9. 重启系统

    在这里插入图片描述

三. 安装nvidia显卡驱动

参考文章 :Ubuntu18-22.04安装和干净卸载nvidia显卡驱动——超详细、最简单

1. 安装依赖

	sudo apt-get update   #更新软件列表
	sudo apt-get install g++
	sudo apt-get install gcc
	sudo apt-get install make

	sudo apt-get install build-essential gcc-multilib dkms
>如果遇到无法下载的情况,可能是因为安装完系统后源不可用,可以先更换国内镜像源后在进行本步骤(换源方法:[写给工程师的 Ubuntu 20.04 最佳配置指南](https://zhuanlan.zhihu.com/p/139305626) 第**2、3**步)

2. 卸载原有驱动

	sudo apt-get remove --purge nvidia*   # 或者nvidia-*

3. 官网下载对应驱动

下载好之后,注意把nvidia驱动放在英文名文件夹下,比如mkdir driver 新建文件夹“driver”
官网地址:Nvidia驱动下载地址
我这里显卡是4090,官网推荐驱动版本为535.54.03

在这里插入图片描述
在这里插入图片描述

4. 禁用nouveau

sudo gedit /etc/modprobe.d/blacklist.conf 或者(blacklist-nouveau.conf)

(如果没有gedit输入以上指令会报错,可以 sudo apt-get install gedit 安装 gedit 或使用 nano 代替 gedit )

在打开的blacklist.conf末尾添加如下,保存文本关闭

blacklist nouveau
options nouveau modeset=0

在终端输入如下命令,进行更新

sudo update-initramfs –u

更新结束后重启电脑

sudo reboot

重启后在终端输入如下命令,如果没有输出则说明成功禁用nouveau

lsmod | grep nouveau

5. 停止当前的显示服务器

最简单的方法是使用telinit命令更改为运行级别3。在终端输入以下linux命令后,显示服务器将停止。

sudo telinit 3

一般执行完上述命令后,系统自动进入文本界面tty;
如果进不去,就按Ctrl + Alt + F1~F6中的一个 (分别对应进入tty1~tty6)
然后输入用户名和密码

6. 在文本界面中,禁用X-window服务

在终端输入

sudo /etc/init.d/gdm3 stop或者(sudo service gdm3 stop)

7. 安装驱动

cd命令进入到存放驱动的目录,输入命令(命令中的文件名以你下载的驱动为准)

sudo chmod 777 NVIDIA-Linux-x86_64-535.54.03.run   #给你下载的驱动赋予可执行权限,才可以安装
sudo ./NVIDIA-Linux-x86_64-535.54.03.run –no-opengl-files   #安装

安装过程中可能出现的选项

问题 选项
The distribution-provided pre-install script failed! Are you sure you want to continue? yes
Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later? No
Nvidia’s 32-bit compatibility libraries? No
Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up. No

以上问题并非按我写的顺序出现,但是当时没有截图所以忘记顺序了。表格中最后一个问题需要注意,在其它的教程中,这个问题选yes,但是在我安装系统的过程中,选yes会导致电脑重启后无法正常开机。所以这里我选了No,重启后能够正常开机。(Ubuntu20.04 、显卡4090)

8. 重启图形界面

安装完成后退回图形界面:

sudo init 5 

or

ctrl + alt + f7 

or

sudo service gdm3 restart

或者终端输入 reboot 重启

9. 测试显卡驱动是否安装成功

终端输入:

	nvidia-smi

出现类似下图的界面,说明成功安装驱动
在这里插入图片描述

四. 安装CUDA

为了能够使用pytorch2,我在这里安装的CUDA11.8版本。
参考教程:CUDA_11.8安装-知乎

1. 官网下载CUDA

CUDA Toolkit 11.8 Downloads
在这里插入图片描述
按照图中选项选择可以得到两条命令

2. 下载CUDA

终端输入上一步获得的命令,下载runfile文件

	wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run

3. 安装

执行上一条命令下载runfile文件后,cd到文件所在路径,执行下面的命令,安装cuda

sudo sh cuda_11.8.0_520.61.05_linux.run

执行后稍微等待,会出现如下画面
在这里插入图片描述
输入accept后按回车继续
在这里插入图片描述

上下移动光标到Driver位置,按空格取消选择;用相同的操作取消另外三个选项,只安装CUDA Toolkit 11.8主体(如图)

继续移动光标到Options,按回车,进入安装配置界面(如下)

在这里插入图片描述

光标移动到Toolkit Options,按回车,进入CUDA安装配置界面\

在这里插入图片描述

如上图,去掉所有多选选项,特别是Create symbolic link from /usr/local/cuda选项,最好是去掉。这样安装完成后,是不会在/usr/local/下生成cuda软链接目录。这个软链接目录在安装过程中是不可修改的,当我们安装多版本CUDA时,会重复覆盖这个软链接目录,对我们使用CUDA会产生不必要的麻烦。

CUDA默认安装在/usr/local/目录下,一般Change Toolkit Install Path可以不做修改。但如果是普通用户安装,需设定安装路径为用户主目录下,光标移动到Change Toolkit Install Path按回车,手动修改安装路径后按回车退出路径配置界面

在这里插入图片描述

如果想要修改路径,可以设置为自己想要放在的位置,如 /home/用户名/app/cuda-11.8/

4. 设置CUDA环境

如果上一步选择用root用户安装在默认路径,则普通用户环境变量配置如下示例:

export PATH=/usr/local/cuda-11.8/bin:$PATH
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.8/lib64

如果是普通用户安装在自己的用户目录下,环境变量配置如下示例:

export PATH=/home/duyong/apps/cuda-11.8/bin:$PATH
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/duyong/apps/cuda-11.8/lib64

使用户配置文件即刻生效

source ~/.bashrc

验证CUDA是否安装成功

nvcc -V

如果有类似如下输出说明安装成功

nvcc: NVIDIA ® Cuda complier driver
Copyright © 2005-2022 NVIDIA Coropration
Bulit on Wed_Jun__8_16:49:14_PDT_2022
Cuda copiltation tools, release 11.7, V11.7.99
Build cuda_11.7.r11.7/compiler .31442593_0

安装完成后重启

五. 安装CUDNN

官网下载地址:(需要注册)

https://developer.nvidia.com/cudnn
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
点击下载,下载完成后解压文件,在当前文件夹下打开终端,输入:

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

此步操作为拷贝文件到指定位置,并赋予权限

验证是否安装成功,输入:

cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

安装成功会有类似下图的输出
在这里插入图片描述

六. 安装Anaconda

参考:Ubuntu 20.04安装Anaconda3及简单使用

七. 安装Pytorch2

参考:超详细 Ubuntu安装PyTorch步骤

参考文章

  1. https://zhuanlan.zhihu.com/p/590877041
  2. https://blog.csdn.net/hwh295/article/details/113409389
  3. https://blog.csdn.net/Perfect886/article/details/119109380
  4. https://zhuanlan.zhihu.com/p/61255639
  5. https://blog.csdn.net/m0_50117360/article/details/108403586
  6. https://blog.csdn.net/KRISNAT/article/details/124068391

猜你喜欢

转载自blog.csdn.net/qq_43775794/article/details/131770933