Ubuntu 18.04.6 LTS は NVIDIA グラフィックス ドライバー、CUDA、cuDNN をインストールします

1. カーネルの説明

        次のコマンドで、Ubuntu 18.04 のインストールされているカーネルをクエリできます。

grep menuentry /boot/grub/grub.cfg

        上の図は、Ubuntu に合計 6 つの Linux カーネルがインストールされていることを示しています。

        現在使用中の Linux カーネルは、次のコマンドで照会できます。

uname -a

        出力は、カーネル「GNU/Linux 4.15.0-041500-generic x86_64」が使用されていることを示しています。

Linux amax-PowerEdge-T640 4.15.0-041500-generic #201802011154 SMP 木 2 月 1 日 11:55:45 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux

2. グラフィックス カード ドライバーをインストールします。

        背景:Ubuntu 18.04.6 LTS + GNU/Linux 5.4.0-131-generic x86_64

このブログのインストール方法 Ubuntu18.04 [ネットワーク全体に穴がなく、超完全な手順] に従って Nvidia ドライバーをインストールしました        。その後、一連の問題が発生しました。最初は

sudo apt-get install build-essential 

        build-essential のインストールには大きな問題があります。たとえば、build-essential は事前に xx の依存関係をインストールする必要があります。この依存関係がないと、build-essential を正常にインストールできません。その結果、ターミナルのプロンプトを素直に聞いて gcc と cmake をインストールしましたが、xx の依存関係がまだ不足していることがわかりました。とてもイライラします。

        そうするとインストールできないのでインストールせず、そのまま使うつもりです

sudo sh ./NVIDIA-Linux-x86_64-510.73.05.run

        NVIDIA グラフィックス カード ドライバーのインストールは単純であることが判明しました。gcc および cmake は、NVIDIA グラフィックス カード ドライバーをインストールするために必要な手順ですこれら 2 つがインストールされていない場合は、次のようなエラーが報告されます。

 エラー: パス内に開発ツール `cc` が見つかりません。パッケージ「gcc」がインストールされていることを確認してください。gcc がシステムにインストールされている場合は、「cc」が PATH に含まれていることを確認してください。

        ただし、gcc のインストールには多くの依存関係が必要であり、これらの依存関係は apt-get install ではインストールできません。とても面倒だったので、別の方法を探す必要がありました。しかし、最終的にはもう少し良い解決策を見つけました。

sudo aptitude install xxxx

        gcc や cmake をインストールするためのコマンドなど。aptitude コマンドを使用できない場合は、apt-get install を通じて aptitude ツールをインストールすることをお勧めします。aptitude ツールは、より人間らしい方法でいくつかのパッケージやソフトウェアをインストールできます。apt-get install ほど直接的ではないインストール ソリューションを常に提供できます (インストールの失敗は失敗を意味し、多くのエラーが報告されます) )。

        あとはaptitudeツールを使って、ぼんやりと gcc と cmake をインストールしました。

        その後、喜んで NVIDIA グラフィックス カード ドライバーをインストールしました。でも、これで終わりだと思いますか?いいえ、また次のエラーが発生しました

エラー: X サーバーを実行しているようです。インストールする前に X を終了してください。詳細については、www.nvidia.com の Linux ドライバー ダウンロード ページにある README の「NVIDIA ドライバーのインストール」セクションを参照してください。

        しかし幸いなことに、このエラーは比較的簡単に解決できます。たとえば、 NVIDIA グラフィック カード ドライバーのインストールに「 -no-x-check」を追加するだけです。

sudo sh ./NVIDIA-Linux-x86_64-510.73.05.run -no-x-check

        このようにして、NVIDIA グラフィック カード ドライバーのインストール プロセスにほぼ入ることができます。その結果、インストールが 47% に達すると、次のような別のエラーが報告されました。

ステップ「カーネルモジュールの構築」の実行中にエラーが発生しました。詳細については、/var/log/nvidia-installer.log を参照してください。

        次に、NVIDIA グラフィック カード ドライバーをインストールするためのさまざまな方法を調べました。たとえば、インターフェイスに付属の「ソフトウェア/ドライバー」アップデートを使用するか、apt-get install コマンド ラインを使用してオンラインでダウンロードしてインストールするか、インストール パッケージを変更します。しかし、上記の作業は無駄です。主な理由は、現在の「GNU/Linux 5.4.0-131-generic x86_64」Linux カーネルが最新の NVIDIA グラフィックス ドライバーをサポートしていないことですこの場合、何千ものインストール方法を使用して NVIDIA グラフィック カード ドライバーをインストールすることはできません。

その後、カーネルを5.4 から4.15に変更したいと考えています        (この考えは正しいです) (インターネットでの検索結果によれば、NVIDIA グラフィックス カード ドライバーは 4.15 Linux カーネルでサポートされていることが最も多いためです)。みんなの Linux カーネルは 4.15)がたくさん さらに、一部の人が Linux カーネルをアップグレードしたために、NVIDIA グラフィック カード ドライバーが使用できなくなることもわかりました (たとえば、「nvidia-smi」コマンドが直接失敗するなど)。

        そこで、Linuxカーネルが高すぎて NVIDIA グラフィック カード ドライバーがこのブログと一致しないという事実を考慮して、 Ubuntu 18.04 にLinux 4.15 カーネルをインストールしました

インストール後、カーネルの起動シーケンスを更新する        必要があります手順は次のとおりです。

        最初のステップは、次のコマンドを使用して、このマシンにインストールされている Linux カーネルを表示することです。

grep menuentry /boot/grub/grub.cfg

        取得したカーネル リストには次のようにインデックスが付けられます。

        次に、インデックス「4」を持つカーネルが使用したいものになります。

        2 番目のステップは、次のコマンドを使用してデフォルトのカーネル起動シーケンスを変更することです。

sudo vim /etc/default/grub

        「grub」ファイルの GRUB_DEFAULT=0 を次のように変更します。

GRUB_DEFAULT=“1>4"

        上の「4」はカーネル インデックス「4」です。つまり、コンピュータの起動後にデフォルトで選択されるカーネルとして「Linux 4.15.0-041500-generic」を設定します。

        3 番目のステップは、カーネルの起動シーケンスを更新し、コマンドを実行することです。

update-grub

        4 番目のステップでは、マシンを再起動します

sudo reboot

        次に、次のコマンドを使用して、再起動されたカーネルをクエリします。

uname -a

        端末が出力します

Linux amax-PowerEdge-T640 4.15.0-041500-generic #201802011154 SMP 木 2 月 1 日 11:55:45 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux

3.CUDAをインストールする

cuda と cuDNN をインストールするには、        ブログ Ubuntu を参照してください

        これは難しいことではなく、インストール パッケージをダウンロードしてインストールするだけです。ただし、インストール プロセス中に NVIDIA グラフィック カード ドライバーを再インストールしないでください。つまり、[ ] ドライバーはスペースバーを制御してキャンセルする必要があります。

        また、「~/.bashrc」ファイルを更新する際には、

export PATH=$PATH:/usr/local/cuda/bin  
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64  
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64

        上記のパス「/usr/local/cuda/」は、 cuda実際のインストール パスに変更する必要があります。たとえば、私のパスは

/usr/local/cuda-7.5/

        cuda が正常にインストールされているかどうかを確認する

nvcc --version

        成功すると出力されます

nvcc: NVIDIA (R) Cuda コンパイラ ドライバー
Copyright (c) 2005-2022 NVIDIA Corporation
Built on Tue_May__3_18:49:52_PDT_2022
Cuda コンパイル ツール、リリース 11.7、V11.7.64
Build cuda_11.7.r11.7/compiler.31294372_0

4.cuDNNをインストールする

cuDNN をインストールする場合は、 Ubuntu への CUDA と cuDNN のインストールに関するこのブログ        も参照してください取り付けは難しくありません。

        注意すべき点は、ダウンロードするときにまず NVIDIA の公式 Web サイトにログインする必要があり、その後ダウンロードされたインストール パッケージが「cudnn-local-repo-ubuntu1804-8.4.1.50_1.0-1_amd64.deb」のみであったことです。したがって、行を実行するだけで済みます

sudo dpkg -i cudnn-local-repo-ubuntu1804-8.4.1.50_1.0-1_amd64.deb

        cuDNNをインストールできます。

        インストール後、次のコマンドを使用して、インストールが成功したかどうかを確認できます。

dpkg -l | grep cudnn

        成功すると表示されます

ii cudnn-local-repo-ubuntu1804-8.4.1.50 1.0-1 amd64 cudnn-local リポジトリ構成ファイル

五、あとがき

        NVIDIA グラフィック カード ドライバーをインストールするのは難しすぎます。以下の nvidia-smi コマンドのスクリーンショットをアップロードして、NVIDIA グラフィック カード ドライバーのコア要素を記録します (ただし、重要な情報はなく、NVIDIA グラフィック カード ドライバーがインストールされていることを示しているだけです)正常にインストールされました)。

        Linux サーバー管理には落とし穴が多すぎます。友達全員が一生懸命勉強することを願っています。質問がある場合は、メッセージを残してください。問題の解決策を一緒に交換することができます。ブロガーも皆を助けることに非常に熱心です~

        上記のブログは個人が遭遇した問題を記録しているだけですので、もし遭遇した問題が解決できなくても私を責めないでください(笑)、ご理解、愛、敬意に感謝します!コメントエリアへようこそ、ご質問をお受けします~

おすすめ

転載: blog.csdn.net/qq_36158230/article/details/127738833