Tesla P100 サーバーへの Rocky Linux 8.4 の導入とグラフィックス カードの cudnn インストール - 非常に合理化

Rocky Linux チュートリアルをインストールする

https://developer.aliyun.com/article/1074889

予防

  1. Tesla P100 サーバー、Delete キーを押して BIOS に入り、Daul モードを設定し、最初のオプションとして UEFI ハードディスクを選択し (ドライブ ディスクでこれを選択します)、USB に UEFI USB を選択します。

  2. Rocky linux をインストールするとき、これら 2 つの項目はデフォルトであり、簡単に変更しないでください。そうしないと、次のステップをインストールできない可能性があります。

ここに画像の説明を挿入

本番環境のインストール (Nvidia ドライバーと cuda、cudnn などのインストール)

Nvidia チュートリアル: https://blog.csdn.net/dendi_hust/article/details/111177699
cuda と nvidia 間の対応: http://www.8fe.com/jiaocheng/2376.html
ドライバーのダウンロード: https://www. nvidia.cn/download/driverResults.aspx/207499/cn/
グラフィックス カードとドライバー情報の表示: https://blog.csdn.net/m0_67403073/article/details/126749126
cuda および cudnn のインストール: https://blog.csdn .net/bluewind_1988/article/details/105244396
cuda と cudnn の関係: https://www.jianshu.com/p/622f47f94784

NIC 構成パラメータの意味: https://blog.csdn.net/z1014347942/article/details/78069966
静的 IP 設定: https://jingyan.baidu.com/article/9989c746d2161af649ecfe44.html

予防

  1. たとえば、GPU ドライバーをインストールできない場合、「現在実行中のカーネルのカーネル ソース ツリーが見つかりません。システムにはカーネルがありません。システムがカーネルを見つけられない可能性があります。この時点では、 /usr/src/kernels ファイルに移動して、カーネル ファイルがあるかどうかを確認できます。存在する場合は、
    NVIDIA をインストールするときに –kernel-source-path /usr/src/kernels/your own kernel を追加します。次に例を示します。
bash ./NVIDIA-Linux-x86_64-440.64.00.run  --kernel-source-path  /usr/src/kernels/自己的内核

解決できません。参照: https://blog.csdn.net/chris_pei/article/details/79203033
https://www.cnblogs.com/liuke-note/p/13712202.html?ivk_sa=1024320u

  1. 独自のグラフィックス カードのバージョンを検索するときは、一部のドライバー シリーズが一緒になっているという事実に注意する必要があります。たとえば、Tesla シリーズは Data Center と一緒になっています。
    ここに画像の説明を挿入

  2. 静的 IP を設定するときにサービスを再起動すると、プロンプト: Unit network.service not found:
    再起動コマンドを置き換えます: 'systemctl restart NetworkManager'

  3. nvidia のインストール時に次のエラーが発生します。「requires nvidia-kmod =」Web ページを参照してください:
    https://thelinuxcluster.com/tag/nvidia/

  4. cuda のインストール時に次のエラーが発生します:「ドライバー コンポーネントのインストールに失敗しました」: 参照:
    https://blog.csdn.net/bluewind_1988/article/details/105244396

  5. cuda をインストールした後、nvcc が使用可能であることを示すプロンプトは表示されません。https:
    //blog.csdn.net/weixin_44750512/article/details/123156020を参照してください。

condaをインストールする

チュートリアル: https://blog.csdn.net/qq_44173974/article/details/125336916

おすすめ

転載: blog.csdn.net/weixin_44077556/article/details/131899820