Ubuntu20.04下RTX30系列显卡快速配置深度学习环境

       RTX30XX目前好像还没办法很方便的在RTX30系列GPU上通过pip/conda安装TensorFlow或Pytorch。因为这些GPU需要CUDA11.1,而当前主流的TensorFlow/Pytorch版本不是针对CUDA11.1编译的。如果要在30XXGPU上运行这些库的话,需要很强的动手能力,手动编译或者使用英伟达docker容器。因此我们可以选择使用Lambda Stack实现一行代码配置深度学习环境。

一、Lambda Stack

       Lambda Stack 的网址:Lambda Stack

1. Lambda Stack简介

       Lambda Stack,提供一行代码安装并可以管理升级,包含:Pytorch、TensorFlow、CUDA、cuDNN和NVIDIA驱动程序,它与Ubuntu20.04LTS,18.04LTS和16.04LTS兼容。因此配置深度学习环境变得非常简单。

Lambda Stack包括:
● 操作系统能够Ubuntu20.04,18.04,16.04(桌面版和服务器版本都可以)
● Docker images of Lambda Stack + Ubuntu: Lambda Stack Dockerfiles
● 包含的深度学习框架: TensorFlow, Keras, PyTorch, Caffe, Caffe 2
● 包含的GPU 软件: CUDA, cuDNN, NVIDIA驱动
● 包含工具: git, tmux, screen, vim, emacs, htop, valgrind, build-essential

2. 系统要求

● NVIDIA GPU(如RTX3070,3080,3090,2080Ti,Quadro RTX 8000)
● Ubuntu20.04,18.04,16.04(桌面版和服务器 版都可以)

3. 安装

① 如果是桌面版Ubuntu20.04,18.04,16.04,安装Lambda Stack(桌面版):

LAMBDA_REPO=$(mktemp) && \
wget -O${LAMBDA_REPO} https://lambdalabs.com/static/misc/lambda-stack-repo.deb && \
sudo dpkg -i ${LAMBDA_REPO} && rm -f ${LAMBDA_REPO} && \
sudo apt-get update && sudo apt-get install -y lambda-stack-cuda
sudo reboot

注意:安装完毕会自动重启,安装过程需要一段时间。

② 如果是服务器版Ubuntu20.04,18.04,安装Lambda Stack(服务器版1):

LAMBDA_REPO=$(mktemp) && \
wget -O${LAMBDA_REPO} https://lambdalabs.com/static/misc/lambda-stack-repo.deb && \
sudo dpkg -i ${LAMBDA_REPO} && rm -f ${LAMBDA_REPO} && \
sudo apt-get update && \
sudo apt-get --yes upgrade && \
sudo apt-get install --yes --no-install-recommends lambda-server && \
sudo apt-get install --yes --no-install-recommends nvidia-headless-450 && \
sudo apt-get install --yes --no-install-recommends lambda-stack-cuda

注意:安装完毕需要重启

③ 如果是服务器版的Ubuntu16.04,安装安装 Lambda Stack (服务器版2):

LAMBDA_REPO=$(mktemp) && \
wget -O${LAMBDA_REPO} https://lambdalabs.com/static/misc/lambda-stack-repo.deb && \
sudo dpkg -i ${LAMBDA_REPO} && rm -f ${LAMBDA_REPO} && \
sudo apt-get update && \
sudo apt-get --yes upgrade && \
sudo apt-get install --yes --no-install-recommends lambda-server && \
sudo apt-get install --yes --no-install-recommends nvidia-440 libcuda1-440 nvidia-opencl-icd-440 && \
sudo apt-get install --yes --no-install-recommends lambda-stack-cuda

注意:安装完毕需要重启

扫描二维码关注公众号,回复: 12394472 查看本文章

4. 系统升级

       如果有要更新版本的Pytorch、Tensorflow、CUDA或cuDNN发布,只需运行:

sudo apt-get update && sudo apt-get dist-upgrade

然后重启。

5. 使用

1)正常安装方式:只需要运行python命令即可进入,可以使用TensorFlow、Pytorch等。

$ python
>>> import tensorflowimpo
>>> tensorflow.__version__
'2.3.2'
>>> import torch
>>> torch.__version__
'1.7.1'

2)Docker方式安装:需要运行docker镜像:

 sudo docker run -it ubuntu /bin/bash  #ubuntu代表镜像名称,需要更改

6. 注意事项

       pip如果没有安装,需要安装wget和pip(docker里没有这两个命令,需要安装)

 sudo apt-get install wget
wget https://bootstrap.pypa.io/get-pip.py -o get-pip.py
python get-pip.py

猜你喜欢

转载自blog.csdn.net/Roaddd/article/details/113109409