一 硬件配置
配置 型号 数量
主板 华硕Z10PE-D8 WS*1
内存 三星 2400 ECC-R 16G* 4
CPU 2673 V3 (2.4主频 12核24线程)* 2
风扇 金钱豹10热管全静音 *2
电源 肯为 GPU计算 挖矿 1600w *1
机箱 勤诚RM41300 G特制机箱 (支持4显卡)* 1
显卡 技嘉1080TI GAMING OC 11G *4
固态 INTER 545s 256G *2
机械 希捷2T企业盘 *2
二 安装
1.安装Ubuntu:
使用U盘进行Ubuntu操作系统的安装:
参考:https://jingyan.baidu.com/article/a3761b2b66fe141577f9aa51.html
一开始安装选择"Install Ubuntu"回车后过一会儿屏幕显示“输入不支持”,这是ubuntu对显卡的支持有关,在安装主界面的F6,选择nomodeset,就可以进入下一步安装了
安装过程略
2.安装ssh:
sudo apt-get install openssh-server
3. 安装1080TI显卡驱动:
sudo apt-get purge nvidia*
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update && sudo apt-get install nvidia-384 nvidia-settings
注意:sudo apt-get purge nvidia* 是清理以前安装过的nvidia驱动,没有装过可以忽略这条命令。
安装完毕后重启机器,运行 nvidia-smi,看看生效的显卡驱动:
4.安装CUDA8.0
因为Tensorflow和Pytorch目前官方提供的PIP版本只支持CUDA8,cuda-repo-buntu1604-8-0-local-ga2_8.0.61-1_amd64.deb"
和 "cuBLAS Patch Update to CUDA 8":
进入目录后,执行命令:
sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb
sudo apt-get update
sudo apt-get install cuda
sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-cublas-performance-update_8.0.61-1_amd64.deb
sudo apt-get update
sudo apt-get upgrade cuda
注意:百度云也可以下载:链接:https://pan.baidu.com/s/1mjDIfJM 密码:f2cx
在 ~/.bashrc 中设置环境变量:
sudo vi ~/.bashrc
在最后添加:
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda
运行 source ~/.bashrc 使其生效
5.安装CUDNN
CUDA8 的最佳拍档依然是cuDNN6.0(7.0目前运行tensorflow会报错),在NIVIDA开发者官网上,找到cudnn的下载页面: https://developer.nvidia.com/rdp/cudnn-download ,选择"Download
cuDNN v6.0 (April 27, 2017), for CUDA 8.0" 中的
"cuDNN v6.0 Library for Linux":
下载后安装非常简单,就是解压然后拷贝到相应的系统CUDA路径下,注意最后一行拷贝时 "-d"不能少,
tar -zxvf cudnn-8.0-linux-x64-v6.0.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d
没有报错就是全部安装完成了。
6.安装Tensorflow GPU 1.4
由于Anaconda 可以提供完整的科学计算库,所以直接使用Anaconda
来进行相关的额安装。
6.1安装Anaconda
下载地址:https://www.anaconda.com/download/
这里我们下载Python 3.6 64bit 的Anaconda
4.4.0,直接安装即可。
6.2在Anaconda中安装TensorFlow GPU 1.4
conda create --name tf python=3.6 #创建tf环境
source activate tf #激活tf环境
pip install --ignore-installed --upgrade tensorflow-gpu
备注 其他命令:
source deactivate tf #退出tf环境
conda remove --name tf --all #删除tf环境(全部删除)
将会自动安装如下组件
numpy
wheel
tensorflow-tensorboard
six
protobuf
html5lib
markdown
werkzeug
bleach
setuptools
使用下列代码测试安装正确性
6.3测试
命令行下:
source activate tf
python
输入以下代码:
import tensorflow as tf
hello = tf.constant('Hello, TensorFlow!')
sess = tf.Session()
print(sess.run(hello))
没有报错就是配置好了。