ディレクトリ
Ubuntuのserver16.04インストール設定ドライバ418.87、cuda10.1、cudnn7.6.4.38、Anacondaは、pytorch超詳細な分解します
要約を収集するために、私はプロのインストール遭遇したこの記事の問題によるとREFERENCEの終了を確認するために具体的な言及をしました
GCCのインストール
サーバー版は、GCCを装備したが、NVIDIAのドライバのインストールは、GCCが必要ですが、ソースを変更しようとした、ソフトウェアライブラリを更新だけでなく、最終的には、解決されないoverstackいくつかの方法は、問題がビルド不可欠なパッケージをインストールすることによって解決することができ、それは意志が見つかりません++はgcc、gを含む新しいパッケージの束をインストールしてください。
sudo apt install build-essential
NVIDIAのドライバをインストールします。
あなたが原因で直接駆動するダイレクト低くインストールCUDAドライバのバージョンにインストールすることを選択した場合、最初のロードの仕方によって、CUDAドライブを意味します。
1.アンインストール古いドライバ(手段をスキップしません)
- 一般的な方法、
sudo apt-get remove –purge nvidia*
- 第二の方法、非公式のネットワークドライブ
sudo apt-get remove --purge nvidia(版本全称,如我的nvidia-384.130)
- 方法3、公式サイトのドライブ
sh ./nvidia.run --uninstall
2.無効にヌーボー
NVIDIAをインストールし、システムを無効にする必要があり、ドライバが付属しています
ファイルを開きます
sudo gedit /etc/modprobe.d/blacklist.conf
テキストの最後に追加します。
blacklist nouveau option nouveau modeset=0
警告無視
WQ、実行
sudo update-initramfs -u
テスト、
lsmod | grep nouveau
成功を無効にするには、no出力命令
3. NVIDIAグラフィックスドライバをインストールします。
表示ドライバのバージョンサポート
sudo apt-cache search nvidia*
通常、最大罰金に等しいより大きいバージョンをインストールし、私は418.87をインストールNVIDIAのドライバをダウンロードし、
(私はssh接続を使用していないので、私にはまったく影響したため、このステップは黒になりますので、最高のは、予備のコンピュータを持っている...)Xサーバを無効にします
sudo service lightdm stop
フーとダウンロードディレクトリにファイルをCDに実行権限を
cd ~ sudo chmod a+x NVIDIA-Linux-x86_64-384.130.run
インストール
sudo sh ./NVIDIA-Linux-x86_64-375.20.run –no-opengl-files
検出に成功したかどうか
nvidia-smi
インストールCUDA10.1
Xサービス(黒)を無効にします
sudo service lightdm stop
フーは、ファイルへのアクセス権を実行してインストール
sudo chmod a+x cuda_10.1.243_418.87.00_linux.run sudo sh cuda_10.1.243_418.87.00_linux.run --override
受け入れられ、ドライブに加えて、他の選択肢を選択されていません。
設定ファイル開き
vim ~/.bashrc
の最後に書かれたが、export PATH=/usr/local/cuda-8.0/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
有効になります
source ~/.bashrc
検出に成功したかどうか
nvcc -V
インストールcudnn
ダウンロードする公式サイト、および表示するペアcudnn CUDAバージョン見つけペアの公式サイトを、だけでなく、ペアリングのより包括的なバージョン 10.1、ので、私のCUDA、cudnn選挙は7.6.4です
アーカイブおよび抽出物に追加ダウンロード
# compression cp cudnn-8.0-linux-x64-v5.1.solitairetheme8 good.tgz # decompression tar -xvf good.tgz
安装,其实就是改变文件位置和权限
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/ $ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d $ sudo chmod a+r /usr/local/cuda/include/cudnn.h $ sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
查看cudnn版本:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
以上便配置好服务器,以下为非root用户根据需要安装。
我安装的是anaconda、tensorflow、pytorch
安装anaconda
卸载anaconda(如有)
rm-rf ~/anaconda
,然后修改配置文件~/.bashrc
官网下载并安装
配置文件/home/yourusername/.profile,在最后一行添加如下
# Anaconda export PATH=$PATH:/home/username/anaconda3/bin
生效
source /home/username/.profile
安装tensorflow
查看官网配对,确定安装版本
# 如果你安装的是 Python 3.6 版的Anaconda:
conda create --name tf_gpu_env tensorflow-gpu # tf_gpu_env是这个环境的名字
# 如果你安装的是 Python 3.7 版的Anaconda,则需要声明新创建的环境使用 Python 3.6:
conda create --name tf_gpu_env python=3.6 anaconda tensorflow-gpu
安装pytorch
新建虚拟环境并激活环境
conda create -n pytorch python=3.7 activate pytroch
查看官网选择版本,获得代码
如我的
解决问题:
- ERROR: Cannot uninstall 'wrapt'. during upgrade
- tensorboard 1.14.0 has requirement setuptools>=41.0.0, but you'll have setuptools 39.1.0
Reference
https://blog.csdn.net/zhang970187013/article/details/81012845
https://www.linuxidc.com/Linux/2019-06/159059.htm
https://blog.csdn.net/Eddy_zheng/article/details/52910249
https://blog.csdn.net/DarrenXf/article/details/82182449
https://blog.csdn.net/qq_41620607/article/details/81236525
https://www.cnblogs.com/onemorepoint/p/7453766.html
https://blog.csdn.net/qq_22474567/article/details/54984257
https://blog.csdn.net/yuejisuo1948/article/details/81043962
https://github.com/tensorflow/tensorflow/issues/30191
https://blog.csdn.net/weixin_44179909/article/details/96973208