在配置过程中出现的坑,我也会提出来,以便大家以后避免踩坑!
一 、硬件环境
显卡: NVIDIA RTX 2080ti *4
内存: 32G*4
CPU: 2630 V4* 2
电源: 2000 W
硬盘: 1T + 4T*2
二、软件环境
Linux系统:Ubuntu16.04
CUDA:10.1
CUDNN: 7.5
一些说明:因为服务器预装系统,所以在安装系统这一步没有步骤说明,可以参考黄海广博士知乎专栏
三 、Anaconda安装
值得庆祝的是,清华镜像在关闭一段时间后重新打开了,所以大家可以在这里下载所需版本的Anaconda(在这之前从官网下载的版本,安装以后一直各种问题,避免踩坑,最好从清华镜像下载对应版本)。我下载的是Linux最新版本。
下载完以后放在对应文件夹,打开终端输入:
bash Anaconda3-5.3.1-Linux-x86_64
#bash后是安装的Anaconda版本
按照提示安装即可,没有什么问题。
安装完以后配置相应的路径:
export PATH="路径名"
四、Pip与Conda镜像配置
因为清华镜像恢复,所以我们在此将pip,conda都配置为清华镜像。
(1)Pip镜像配置
临时镜像下载:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple Installation package name
新建.pip文件,如果file exist则可跳过此步
mkdir ~/.pip
以下配置永久镜像(最好直接复制)
cat > ~/.pip/pip.conf << EOF
[global]
trusted-host=mirrors.mirrors.pypi.tuna.tsinghua.edu.cn
index-url=https://pypi.tuna.tsinghua.edu.cn/simple
EOF
(2)Conda镜像配置
直接在终端输入以下命令即可:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
输入命令:conda config --show 查看是否有镜像配置
至此镜像配置完成!
五、环境搭建
为了隔离各个框架,防止环境兼容问题导致环境崩,我们建立几个常用深度学习框架的虚拟环境。
source activate tf37 #激活tf环境
source deactivate tf37 #退出tf环境
conda remove --name tf37 --all #删除tf环境(全部删除)
(1)建立python3.7的pytorch的虚拟环境
conda create --name pytorch python=3.7
pip安装pytorch:(推荐使用pip安装,快且稳定)
pip install https://download.pytorch.org/whl/cu100/torch-1.1.0-cp37-cp37m-linux_x86_64.whl
pip install https://download.pytorch.org/whl/cu100/torchvision-0.3.0-cp37-cp37m-linux_x86_64.whl
输入以下代码,返回True则安装完成!
import torch
print(torch.cuda.is_available())
值得注意的是pytorch版本对应cuda,以及系统版本!
(2)建立python3.7的TensorFlow的虚拟环境
conda create --name tf37 pythn=3.7
pip install tensorflow-gpu
import tensorflowas tf #测试是否安装成功
(3)建立python3.7的Keras的虚拟环境
直接在这个虚拟环境中安装:
pip install keras
六、总结
在安装过程中,开始使用官网的anaconda安装过程中出现很多问题,在此特别感谢清华大学开源软件镜像站!安装环境需要耐心,慢慢来,有时候网络不稳定也会出现一些安装的问题,有时甚至推倒重新安装!