Ubuntuのインストール: グラフィックスドライバー、CUDA、Anaconda
Windows 環境に CUDA と Pytorch をインストールします。「Pytorch の概要」を参照してください。 3. インストール
環境:x86_64
Linux ubuntu18 4.150.0-20-generic
まとめ
このブログは、理解と記憶を深めるために、Ubuntu システムにグラフィックス カード ドライバー、CUDA、Anaconda をインストールする方法をまとめています。
1. NVIDIA グラフィックス カード ドライバーをインストールします。
# 1.查看显卡型号
# 正常实体机的显卡型号是一个16进制的代码,可以通过该代码在网上查询具体型号,如:01:00.0 VGA compatible controller:NVIDIA Corporation Device 1f06 (rev a1)
# 虚拟机的显卡型号会显示虚拟机的适配器,如:00:0f.0 VGA compatible controller: VMware SVGA II Adapter
lspci | grep -i vga
# 2.安装ubuntu显卡驱动软件
# 查看设备可用和推荐的显卡驱动版本
ubuntu-drivers devices
# 若上述命令没有返回,则先更新软件库
# 增加apt的更新源paa
sudo add-apt-repository ppa:graphics-drivers/ppa
# 更新软件库
sudo apt-get update
# 3.按照ubuntu-drivers devices remcommended的驱动进行安装(如下图1所示)
sudo apt-get install nvidia-470 nvidia-settings nvidia-prime
sudo apt install nvidia-utils-470
# 或者可以让ubuntu驱动自动选择安装合适的版本
sudo ubuntu-drivers autoinstall
# 4.查看英伟达显卡信息(显示一次当前GPU占用情况)
nvidia-smi
# 若显示仍无驱动,则重启计算机(服务器)再查看
reboot
# 显示GPU信息(每秒刷新一次并显示)
nvidia-smi -l
# 显示GPU信息(每n+1秒显示一次)
watch -n {
n} nvidia-smi
# 显卡信息解释如下图2所示
アイテム | 説明 |
---|---|
最初の行 | グラフィックカード情報、ドライバーバージョン、互換性のあるCUDAバージョン |
ファン | ファンの速度 |
温度 | 温度(摂氏) |
パフォーマンス | パフォーマンス ステータス。P0 から P12 まで。P0 はその状態の最大パフォーマンスを示し、P12 は最小パフォーマンスを示します。 |
電源 | エネルギー消費 |
バス-ld | GPUバスに関する情報 |
ディスプレーA | Display Active、GPU のディスプレイが初期化されているかどうかを示します。 |
メモリ使用量 | メモリ使用量 |
GPU使用率 | GPU使用率 |
揮発性、不正確。ECC | ECCに関する情報 |
Mを計算する | 計算モード |
3行目 | 各プロセスのビデオメモリ使用量を示します |
2.CUDAをインストールする
Ⅰ. CUDAツールキットをダウンロードしてインストールする
CUDA ツールキットのダウンロード ページにアクセスし、対応するバージョンとシステムを選択します。
主要な問題
ここには 3 つのインストール方法があります: ローカル インストール パッケージ deb (ローカル)、ネットワーク インストール パッケージ deb (ネットワーク)、ローカル スクリプト runfile (ローカル)
まず、最初の 2 つのインストール方法では、公開キーの設定ができない、apt のダウンロード ソースが設定できないという問題が発生する可能性があります。具体的な解決策については、このブログを参照してください。
次に、インストール プロセス中に、ターゲット CUDA ツールキットに対応するグラフィックス カード ドライバーのバージョンがマシン上の元のグラフィックス カード ドライバーのバージョンと正確に一致しない場合、依存関係エラーが表示され、インストールできません。
最後に、一部のブログでaptitude
は を使用してインストールするという解決策が示されていますが、この方法では、デフォルトでマシン上の元のグラフィック カード ドライバーがアンインストールされ、対象の CUDA ツールキットに対応するグラフィック カード ドライバーがインストールされ、このプロセス中にエラーが発生します。
要約すると、runfile
インストール方法を使用することを選択します。用途別のインストールは、上記のバージョンの不完全な対応の問題に対する直接的な解決策ではありませんが、ドライバーをインストールせずに CUDA ツールキットのみをインストールするrunfile
ことを手動で選択するオプションを提供します。
インストール中に、ターゲット CUDA ツールキットのグラフィックス カード ドライバーの対応するバージョンが見つからないというメッセージが表示されます。そのバージョンのグラフィックス カード ドライバーをインストールすることをお勧めします。この時点で、次のように入力します。ユーザーcontinue
同意書に同意しaccept
、カーソルをドライバーに移動し、「 」と入力して回车
、ドライバーのインストールをキャンセルします。
インストールされた cuda ツールキットは/usr/local/
ディレクトリにあります
CUDA ツールキットの環境変数を構成します。
# 编辑配置文件
vim ~/.bashrc
# 在配置文件末尾配置环境变量
export CUDA_HOME=/usr/local/cuda-{
version}
export PATH="/usr/local/cuda-{version}/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-{version}/lib64:$LD_LIBRARY_PATH"
alias sudo='sudo env PATH=$PATH'
# 刷新配置文件
source ~/.bashrc
インストールの確認
nvcc -V
Ⅱ.cuDNNのインストール
cuDNN ダウンロード ページにアクセスし(cuDNN をダウンロードする前にアカウントを登録する必要があります)、マシンの該当する CUDA バージョンとシステム タイプに応じて deb パッケージを選択します (ファイルを置き換えるために Linux x86_64 Tar パッケージをダウンロードすることもできます)。
debパッケージを解凍してインストールします
3.アナコンダをインストールする
Anaconda のダウンロード ページにアクセスし、クリックしてDownload
適切なバージョンのインストール パッケージを自動的に選択します。
# 进入下载目录
cd /home/{
用户名}/[下载|download]
# 为文件赋权限
chmod -R 777 Anaconda3-2023.0-1-Linux-x86_64.sh
# 执行脚本
sudo ./Anaconda3-2023.0-1-Linux-x86_64.sh
# 键入回车继续安装
# 一直回车看到协议
# 输入yes继续安装
# 回车确定默认安装目录或手动输入安装目录
annaconda の環境変数を構成する
# 编辑配置文件
vim ~/.bashrc
# 在配置文件末尾配置环境变量(此处使用的是系统默认安装路径
export PATH="/home/{用户名}/anaconda3/bin:$PATH"
インストールの確認
conda --version