1. カーネルの説明
次のコマンドで、Ubuntu 18.04 のインストールされているカーネルをクエリできます。
grep menuentry /boot/grub/grub.cfg
上の図は、Ubuntu に合計 6 つの Linux カーネルがインストールされていることを示しています。
現在使用中の Linux カーネルは、次のコマンドで照会できます。
uname -a
出力は、カーネル「GNU/Linux 4.15.0-041500-generic x86_64」が使用されていることを示しています。
Linux amax-PowerEdge-T640 4.15.0-041500-generic #201802011154 SMP 木 2 月 1 日 11:55:45 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux
2. グラフィックス カード ドライバーをインストールします。
背景:Ubuntu 18.04.6 LTS + GNU/Linux 5.4.0-131-generic x86_64
このブログのインストール方法 Ubuntu18.04 [ネットワーク全体に穴がなく、超完全な手順] に従って Nvidia ドライバーをインストールしました 。その後、一連の問題が発生しました。最初は
sudo apt-get install build-essential
build-essential のインストールには大きな問題があります。たとえば、build-essential は事前に xx の依存関係をインストールする必要があります。この依存関係がないと、build-essential を正常にインストールできません。その結果、ターミナルのプロンプトを素直に聞いて gcc と cmake をインストールしましたが、xx の依存関係がまだ不足していることがわかりました。とてもイライラします。
そうするとインストールできないのでインストールせず、そのまま使うつもりです
sudo sh ./NVIDIA-Linux-x86_64-510.73.05.run
NVIDIA グラフィックス カード ドライバーのインストールは単純であることが判明しました。gcc および cmake は、NVIDIA グラフィックス カード ドライバーをインストールするために必要な手順です。これら 2 つがインストールされていない場合は、次のようなエラーが報告されます。
エラー: パス内に開発ツール `cc` が見つかりません。パッケージ「gcc」がインストールされていることを確認してください。gcc がシステムにインストールされている場合は、「cc」が PATH に含まれていることを確認してください。
ただし、gcc のインストールには多くの依存関係が必要であり、これらの依存関係は apt-get install ではインストールできません。とても面倒だったので、別の方法を探す必要がありました。しかし、最終的にはもう少し良い解決策を見つけました。
sudo aptitude install xxxx
gcc や cmake をインストールするためのコマンドなど。aptitude コマンドを使用できない場合は、apt-get install を通じて aptitude ツールをインストールすることをお勧めします。aptitude ツールは、より人間らしい方法でいくつかのパッケージやソフトウェアをインストールできます。apt-get install ほど直接的ではないインストール ソリューションを常に提供できます (インストールの失敗は失敗を意味し、多くのエラーが報告されます) )。
あとはaptitudeツールを使って、ぼんやりと gcc と cmake をインストールしました。
その後、喜んで NVIDIA グラフィックス カード ドライバーをインストールしました。でも、これで終わりだと思いますか?いいえ、また次のエラーが発生しました
エラー: X サーバーを実行しているようです。インストールする前に X を終了してください。詳細については、www.nvidia.com の Linux ドライバー ダウンロード ページにある README の「NVIDIA ドライバーのインストール」セクションを参照してください。
しかし幸いなことに、このエラーは比較的簡単に解決できます。たとえば、 NVIDIA グラフィック カード ドライバーのインストールに「 -no-x-check」を追加するだけです。
sudo sh ./NVIDIA-Linux-x86_64-510.73.05.run -no-x-check
このようにして、NVIDIA グラフィック カード ドライバーのインストール プロセスにほぼ入ることができます。その結果、インストールが 47% に達すると、次のような別のエラーが報告されました。
ステップ「カーネルモジュールの構築」の実行中にエラーが発生しました。詳細については、/var/log/nvidia-installer.log を参照してください。
次に、NVIDIA グラフィック カード ドライバーをインストールするためのさまざまな方法を調べました。たとえば、インターフェイスに付属の「ソフトウェア/ドライバー」アップデートを使用するか、apt-get install コマンド ラインを使用してオンラインでダウンロードしてインストールするか、インストール パッケージを変更します。しかし、上記の作業は無駄です。主な理由は、現在の「GNU/Linux 5.4.0-131-generic x86_64」Linux カーネルが最新の NVIDIA グラフィックス ドライバーをサポートしていないことです。この場合、何千ものインストール方法を使用して NVIDIA グラフィック カード ドライバーをインストールすることはできません。
その後、カーネルを5.4 から4.15に変更したいと考えています (この考えは正しいです) (インターネットでの検索結果によれば、NVIDIA グラフィックス カード ドライバーは 4.15 Linux カーネルでサポートされていることが最も多いためです)。みんなの Linux カーネルは 4.15)がたくさん さらに、一部の人が Linux カーネルをアップグレードしたために、NVIDIA グラフィック カード ドライバーが使用できなくなることもわかりました (たとえば、「nvidia-smi」コマンドが直接失敗するなど)。
そこで、Linuxカーネルが高すぎて NVIDIA グラフィック カード ドライバーがこのブログと一致しないという事実を考慮して、 Ubuntu 18.04 にLinux 4.15 カーネルをインストールしました。
インストール後、カーネルの起動シーケンスを更新する 必要があります。手順は次のとおりです。
最初のステップは、次のコマンドを使用して、このマシンにインストールされている Linux カーネルを表示することです。
grep menuentry /boot/grub/grub.cfg
取得したカーネル リストには次のようにインデックスが付けられます。
次に、インデックス「4」を持つカーネルが使用したいものになります。
2 番目のステップは、次のコマンドを使用してデフォルトのカーネル起動シーケンスを変更することです。
sudo vim /etc/default/grub
「grub」ファイルの GRUB_DEFAULT=0 を次のように変更します。
GRUB_DEFAULT=“1>4"
上の「4」はカーネル インデックス「4」です。つまり、コンピュータの起動後にデフォルトで選択されるカーネルとして「Linux 4.15.0-041500-generic」を設定します。
3 番目のステップは、カーネルの起動シーケンスを更新し、コマンドを実行することです。
update-grub
4 番目のステップでは、マシンを再起動します
sudo reboot
次に、次のコマンドを使用して、再起動されたカーネルをクエリします。
uname -a
端末が出力します
Linux amax-PowerEdge-T640 4.15.0-041500-generic #201802011154 SMP 木 2 月 1 日 11:55:45 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux
3.CUDAをインストールする
cuda と cuDNN をインストールするには、 ブログ Ubuntu を参照してください。
これは難しいことではなく、インストール パッケージをダウンロードしてインストールするだけです。ただし、インストール プロセス中に NVIDIA グラフィック カード ドライバーを再インストールしないでください。つまり、[ ] ドライバーはスペースバーを制御してキャンセルする必要があります。
また、「~/.bashrc」ファイルを更新する際には、
export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64
上記のパス「/usr/local/cuda/」は、 cudaの実際のインストール パスに変更する必要があります。たとえば、私のパスは
/usr/local/cuda-7.5/
cuda が正常にインストールされているかどうかを確認する
nvcc --version
成功すると出力されます
nvcc: NVIDIA (R) Cuda コンパイラ ドライバー
Copyright (c) 2005-2022 NVIDIA Corporation
Built on Tue_May__3_18:49:52_PDT_2022
Cuda コンパイル ツール、リリース 11.7、V11.7.64
Build cuda_11.7.r11.7/compiler.31294372_0
4.cuDNNをインストールする
cuDNN をインストールする場合は、 Ubuntu への CUDA と cuDNN のインストールに関するこのブログ も参照してください。取り付けは難しくありません。
注意すべき点は、ダウンロードするときにまず NVIDIA の公式 Web サイトにログインする必要があり、その後ダウンロードされたインストール パッケージが「cudnn-local-repo-ubuntu1804-8.4.1.50_1.0-1_amd64.deb」のみであったことです。したがって、行を実行するだけで済みます
sudo dpkg -i cudnn-local-repo-ubuntu1804-8.4.1.50_1.0-1_amd64.deb
cuDNNをインストールできます。
インストール後、次のコマンドを使用して、インストールが成功したかどうかを確認できます。
dpkg -l | grep cudnn
成功すると表示されます
ii cudnn-local-repo-ubuntu1804-8.4.1.50 1.0-1 amd64 cudnn-local リポジトリ構成ファイル
五、あとがき
NVIDIA グラフィック カード ドライバーをインストールするのは難しすぎます。以下の nvidia-smi コマンドのスクリーンショットをアップロードして、NVIDIA グラフィック カード ドライバーのコア要素を記録します (ただし、重要な情報はなく、NVIDIA グラフィック カード ドライバーがインストールされていることを示しているだけです)正常にインストールされました)。
Linux サーバー管理には落とし穴が多すぎます。友達全員が一生懸命勉強することを願っています。質問がある場合は、メッセージを残してください。問題の解決策を一緒に交換することができます。ブロガーも皆を助けることに非常に熱心です~
上記のブログは個人が遭遇した問題を記録しているだけですので、もし遭遇した問題が解決できなくても私を責めないでください(笑)、ご理解、愛、敬意に感謝します!コメントエリアへようこそ、ご質問をお受けします~