【日常】Paddlepaddle v2.1.0更新记录

Paddlepaddle2.1.0终于适配了cuda11
同时PaddleSeg也更新了2.1.0版本,增加了对于更多学习率衰减方式的支持(不用自己改config.py了)
这次也是第一次更新Paddle版本,因此做下记录防止以后踩坑

环境:
GeForce RTX3090
Ubuntu18.04 LTS amd64


主要参考了夜雨dalao的博客:
https://blog.csdn.net/qq_33200967/article/details/80689543

1. 卸载旧版本

查看当前显卡驱动以及cuda版本

nvidia-smi
nvcc -V
cat /usr/local/cuda11.1/version.txt #什么叫多此一举啊.jpg

卸载旧版本Paddlepaddle、PaddleSeg
(因为是用conda安装的,所以其实不需要将旧版本卸载,但由于懒得新建虚拟环境了所以还是卸了)

conda uninstall paddlepaddle-gpu
sudo rm -r /home/user/PaddleSeg

卸载cuda11.1
(之前用的自己编译的版本,虽然也支持cuda11.1,但由于11.1版本bug较多,因此还是卸载)

sudo /usr/local/cuda-11.1/bin/cuda-uninstaller
sudo rm -r /usr/local/cuda-11.1
#cudnn版本刚好可以,因此就没卸载

卸载旧版本显卡驱动

sudo service lightdm stop
sudo /usr/bin/nvidia-uninstall
sudo apt-get --purge remove nvidia*

2.下载新版本并安装

下载cuda11.2

前往https://developer.nvidia.com/cuda-toolkit-archive选择cuda11.2.2
在这里插入图片描述
接下来选择自己的系统版本,选择“runfile(local)”(如果不是因为学校服务器流量有限制,选在线下载也是可以的)
根据给出的提示下载,下载完成后拷贝到服务器上

下载链接
在这里插入图片描述

cuda11.2需要460.32以上版本的nvidia显卡驱动,直接前往官网搜索下载即可
当然这里其实也可以不需要下载显卡驱动,因为cuda安装文件里是自带nvidia_driver的
不过更高版本的驱动修复了一些bug,所以也可以选择下载,只需在cuda安装时取消勾选安装自带驱动程序即可

扫描二维码关注公众号,回复: 13271947 查看本文章

在这里插入图片描述(下载完的两文件)

进入服务器,直接 sudo sh xxx.run(运行下载的两个.run文件)
显卡驱动安装时第一个选continue,是否新建xconfig选yes,安装32位的lib选no

添加环境变量

sudo vim ~/.bashrc
#在bash文件中添加下列内容
export PATH=$PATH:/usr/local/cuda-11.2/bin
export LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:/usr/local/cuda-11.2/lib64
export CUDA_VISIBLE_DEVICES=0,1
source ~/.bashrc

安装Paddlepaddlev2.1.0

conda activate paddle_env #激活paddle虚拟环境
conda install paddlepaddle-gpu==2.1.0 cudatoolkit=11.2 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/ -c conda-forge 

验证安装成功

import paddle

paddle.utils.run_check()
print(paddle.__version__)
输出以下结果则说明安装正常

Running verify PaddlePaddle program ...
W0525 16:13:33.029773 16771 device_context.cc:404] Please NOTE: device: 0, GPU Compute Capability: 8.6, Driver API Version: 11.2, Runtime API Version: 11.2
W0525 16:13:33.032608 16771 device_context.cc:422] device: 0, cuDNN Version: 8.1.
PaddlePaddle works well on 1 GPU.
W0525 16:13:37.251523 16771 parallel_executor.cc:601] Cannot enable P2P access from 0 to 1
W0525 16:13:37.251550 16771 parallel_executor.cc:601] Cannot enable P2P access from 1 to 0
W0525 16:13:39.907956 16771 fuse_all_reduce_op_pass.cc:76] Find all_reduce operators: 2. To make the speed faster, some all_reduce ops are fused during training, after fusion, the number of all_reduce ops is 2.
PaddlePaddle works well on 2 GPUs.
#多显卡未安装NCCL便会出现以上提示
PaddlePaddle is installed successfully! Let's start deep learning with PaddlePaddle now.
2.1.0

安装PaddleSeg (直接从github拉最新版本就行…

git clone https://github.com/PaddlePaddle/PaddleSeg.git

验证

cd PaddleSeg/
python train.py --config configs/quick_start/bisenet_optic_disc_512x512_1k.yml
#能成功完成示例训练则说明没有问题

新的炼丹炉就搭完了~
在这里插入图片描述

END

by QFNU_AtomicD

猜你喜欢

转载自blog.csdn.net/weixin_45441838/article/details/117271922