Ubuntu18.04复现RandLA-Net(SemanticKITTTI数据集)----1.环境配置

本文安装环境:CUDA11.1  cuDNN8.0.4 TensorFlow1.15.4。

RandLA-Net项目运行占用的内存比较大,在装系统时,/home文件夹一定要分出400G左右的内存空间。否则,后面这个项目运行不起来。

1.环境配置

本文是使用ubuntu18.04复现RandLA-Net,使用的深度学习框架是TensorFlow1.15.4。

不管搭建什么样的深度学习框架,首先要知道你要安装的环境有哪些。其次,就是确定环境版本。配置深度学习环境需要的安装包,需要的安装包如下:

1)Anaconda------容器,用于环境管理,可以在其中创建多个不同的深度学习环境

2)GPU工具链-----Nvidia显卡、显卡驱动、CUDA工具套件、cuDNN工具包

  • CUDA(Compute Unified Device Architecture, 计算机构平台) 是NVIDIA推出的一种新的操作GPU计算的硬件和软件架构,能够解决复杂问题。CUDA的支持依赖显卡驱动的版本
  • cuDNN(GPU加速库) 用于深度神经网络的GPU加速库。它主要强调性能、易用性和低内存开销。NVIDIA的cuDNN可以集成到更高级别的机器学习框架中,用来加速神经网络的训练
  • 深度学习框架  主要有:TensorFlow、PyTorch、Caffe、Keras等等。

RandLANet相关资料:

RandLANet源项目

RandLANet作者知乎博客项目讲解:[CVPR 2020 Oral] RandLA-Net:大场景三维点云语义分割新框架(已开源) - 知乎

RandLANet原文链接:https://arxiv.org/abs/1911.11236

1.1环境安装包版本确定

配置环境过程中最麻烦的就是各个安装包版本的确定,不是特别困难,下面为大家逐一讲解。整体思路:根据安装的深度学习框架,依次确定需要的CUDA版本、显卡驱动版本和cuDNN版本。以TensorFlow为例:TensorFlow版本 >> CUDA版本 >> 显卡驱动版本和cuDNN版本。

我安装的是TensorFlow1.15.4在TensorFlow官网查看(需要科学上网,无法科学上网的话,可能无法进入TensorFlow官网)。可以看到TensorFlow1.15需要的安装包版本分别为:CUDA10.0、cuDNN7.4、python2.7或者python3.3-3.7。但是我的显卡是3060,30系列显卡仅支持11.1及以上版本。所以选择安装CUDA11.1  cuDNN8.0.4、python3.6。接下来,逐一安装这几个包。

 同样,安装PyTorch的步骤一样,先去PyTorch官网查看对应版本。如果你要装Pytorch1.13.1,查看PyTorch1.13.1需要的CUDA版本,CUDA11.6或者CUDA11.7。然后再去查找CUDA11.7需要的cuDNN版本和显卡驱动版本。

1.2 环境安装顺序

Anaconda   >>   显卡驱动  >> CUDA11.1 >> cuDNN8.0.4 >> TensorFlow1.15.4

1.Anaconda安装

Anaconda是一个容器,可以在这个容器中创建不同的深度学习环境。直接安装最新版本。andaconda官网下载安装包anaconda官网

 剩下的安装步骤查看一下博客:重启,重启,重启!安装完以后一定要重启。

anaconda安装

2.显卡驱动安装

显卡驱动安装,显卡驱动不一定非要按照CUDA版本安装,安装推荐版本即可。安装主要分为两步,第一步禁用nouveau,第二步安装驱动。

1)禁用nouveau

nouveau开源驱动与NVIDIA驱动相互冲突,如果设备安装了nouveau驱动,NVIDIA驱动将无法正常安装。

在终端中输入:

sudo bash -c "echo blacklist nouveau > /etc/modprobe.d/blacklist-nvidia-nouveau.conf"
sudo bash -c "echo options nouveau modeset=0 >> /etc/modprobe.d/blacklist-nvidia-nouveau.conf"

然后,再输入下面的代码,查看是否禁用成功:

cat /etc/modprobe.d/blacklist-nvidia-nouveau.conf

终端显示:

blacklist nouveau
options nouveau modeset=0

表明禁用成功。

2)安装驱动

先重启内核,内核重启代码:

sudo update-initramfs -u

重启系统。

使用 "Software & Updates" 应用中的 "Additional Drivers" 选项卡来安装 Nvidia 驱动,系统会先搜索可用的驱动,搜索完成后,找一个合适的选中,然后点击Apply Changes。系统会自动安装(时间可能需要半小时左右,耐心等待一下)。
例如:选取Using NVIDIA driver metapackage from nvidia-driver-525(proprietary)。

 安装完成后,重启。

重启之后,在终端输入:

nvidia-smi

显示以下内容,证明安装成功。

3.CUDA11.1.0安装

打开英伟达官网,下载CUDA。

 我下载的是11.1.0版本,选择相应的配置,复制安装指令,在终端安装

然后,按照下面这个博客安装:ubuntu18.04安装cuda和cudnn

4.cuDNN8.0.4安装

进入cuDNN官网,找到合适的cudnn版本,下载对应版本的cuDNN的runtime   developer以及samples

 下载完成后,按照这个博客安装:ubuntu18.04安装cuda和cudnn_cuda11.0.3 ubuntu18.04_FAST-ROBOT的博客-CSDN博客

至此,安装深度学习框架之前的环境已经配置好,接下来开始配置深度学习环境。

5.TensorFlow1.15.4安装

我复现的是RandLaNet,所以以上环境安装完成之后,先创建randlanet的虚拟环境,在randlanet虚拟环境中安装TensorFlow1.15.4,代码如下(注意:这里创建环境的时候选择3.6):

conda create -n randlanet python=3.6

安装中间需要输入一个y,然后等待安装完成。

 激活虚拟环境,激活命令:

conda activate randlanet

接下来操作均在虚拟环境中操作。因为30系列显卡不支持CUDA11.1以下版本,安装tensorflow之前,需要先安装依赖。在桌面上建立一个任意名称的txt文件如:require.txt,将下列对应版本依赖复制进去。

nvidia-cublas==11.2.1.74
nvidia-cuda-cupti==11.1.69
nvidia-cuda-nvcc==11.1.74
nvidia-cuda-nvrtc==11.1.74
nvidia-cuda-runtime==11.1.74
nvidia-cudnn==8.0.4.30
nvidia-cufft==10.3.0.74
nvidia-curand==10.2.2.74
nvidia-cusolver==11.0.0.74
nvidia-cusparse==11.2.0.275
nvidia-dali-cuda110==0.26.0
nvidia-dali-nvtf-plugin==0.26.0+nv20.10
nvidia-nccl==2.7.8
nvidia-pyindex==1.0.5
nvidia-tensorboard==1.15.0+nv20.10
nvidia-tensorrt==7.2.1.4
tensorflow-estimator==1.15.1

切换到桌面上,使用下列命令安装以上依赖:

依赖安装完成之后直接使用pip安装TensorFlow1.15.4。命令如下:

#安装tensorflow的索引
pip install nvidia-pyindex

#安装tensorflow
pip install nvidia-tensorflow==1.15.4

安装完成后,输入下列三个命令验证是否安装成功:

#先在终端输入python
python 

#测试tensorflow         
import tensorflow as tf
#查看版本
tf.__version__

#查看tensorflow是否可用
print('Num GPUs Available: ', len(tf.config.experimental.list_physical_devices('GPU')))

如果没有错误提示,证明安装成功。

至此,深度学习环境搭建完成,下一步安装项目需要的包,测试项目。

猜你喜欢

转载自blog.csdn.net/m0_62648611/article/details/131666706