Installez la dernière version du pilote de la carte graphique NVIDIA sur CentOS7 (affichage graphique)

Version du système : CentOS 7.9.2009

Version du noyau : Linux localhost.localdomain 3.10.0-1160.el7.x86_64 #1 SMP lundi 19 octobre 16:18:59 UTC 2020 x86_64 x86_64 x86_64 GNU/Linux

1. Installer les dépendances

yum -y install epel-release

yum -y install gcc binutils wget

yum -y install kernel-devel

2. Désactivez Nouveau

2.1. Vérifiez si Nouveau est activé

lsmod | grep nouveau

Remarque : Aucune sortie d'information signifie qu'elle a été désactivée. Il n'est pas nécessaire d'effectuer les étapes suivantes ;

2.2. Modifier la configuration

echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist.conf

2.3.Sauvegarde img

mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

2.4.Reconstruire

dracut /boot/initramfs-$(uname -r).img $(uname -r)

2.5. Redémarrez le système

reboot

2.6. Vérifiez s'il est fermé

lsmod | grep nouveau

Remarque : Aucune sortie d'information n'indique une désactivation réussie ;

3. Vérifiez le pilote

3.1. Installer les sources d'elrepo

rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-4.el7.elrepo.noarch.rpm

ou

yum -y install https://www.elrepo.org/elrepo-release-7.0-4.el7.elrepo.noarch.rpm

3.2. Installer nvidia-detect

yum -y install nvidia-detect

3.3. Détecter le pilote de la carte graphique

nvidia-detect -v

Recherche des appareils NVIDIA pris en charge…
[10de:1b06] NVIDIA Corporation GP102 [GeForce GTX 1080 Ti]
Cet appareil nécessite le pilote NVIDIA 510.60.02 actuel kmod-nvidia

4. Installation du pilote

4.1. Télécharger le pilote

wget https://us.download.nvidia.cn/XFree86/Linux-x86_64/510.68.02/NVIDIA-Linux-x86_64-510.68.02.run

Remarque : S'il est détecté que le numéro de version est incompatible avec le mien, vous pouvez remplacer la pièce vous-même.

Suggestion : téléchargez-le sur une clé USB depuis le site officiel de NVIDIA et copiez-le sur le serveur.

Remarque : Nvidia ne fournira que la dernière version, qui est rétrocompatible, donc ce que j'ai installé ici est 510.68.02, pas 510.60.02.

4.2.Autorisation

chmod +x NVIDIA-Linux-x86_64-510.68.02.run

Une erreur sera signalée ici et le service X devra être fermé.

Vérifiez s'il s'agit de gdm (il existe deux types, celui-ci sans serveur appartient à gdm)

systemctl --all|grep gdm
whereis gdm
systemctl stop gdm.service

installer le pilote

systemctl start gdm.service

4.3.Installation

sh ./NVIDIA-Linux-x86_64-510.68.02.run -s

4.4. Afficher les informations de la carte graphique

nvidia-smi

Remarque : les informations affichées indiquent que le pilote de la carte graphique a été installé.
De plus : j'ai également installé
python 3.9.11
pytorch1.11.0
tensorflow-gpu 2.7.0
transformers 4.18.0
cuda 11.3
cudnn 8.2.0
, qui sont tous les dernières versions et je l'ai essayé avec succès.

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 510.68.02    Driver Version: 510.68.02    CUDA Version: 11.6     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  Off  | 00000000:01:00.0  On |                  N/A |
| 49%   82C    P2   246W / 250W |   8944MiB / 11264MiB |     99%      Default |
|                               |                      |                  N/A | 
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A     10400      G   /usr/bin/X                         84MiB |
|    0   N/A  N/A     23147      G   /usr/bin/gnome-shell               84MiB |
|    0   N/A  N/A     29312      C   python                           8771MiB |
+-----------------------------------------------------------------------------+

5. Désinstallez le pilote

5.1. Désinstaller et installer

nvidia-uninstall

5.2. Installation propre

dkms remove

Remarque : il faut installer "yum -y install dkms"

6. Erreurs courantes

1.安装时报错 « ERREUR : Impossible de trouver l'arborescence des sources du noyau pour le noyau en cours d'exécution. Veuillez vous assurer que vous avez installé les fichiers sources du noyau et qu'ils sont correctement configurés ; sur les systèmes Red Hat Linux, par exemple, assurez-vous que le RPM « kernel-source » ou « kernel-devel » est installé. Si vous savez que les fichiers sources du noyau corrects sont installés, vous pouvez spécifier le chemin source du noyau avec l'option de ligne de commande « –kernel-source-path ».

Solution:

Installer les bibliothèques du noyau

yum -y install epel-release
yum -y install kernel-devel

Comparaison des versions du noyau

rpm -qa |grep kernel
uname -r

installer le pilote

./NVIDIA-Linux-x86_64-510.68.02.run --kernel-source-path=/usr/src/kernels/3.10.0-1160.42.2.el7.x86_64 -k $(uname -r)

Je suppose que tu aimes

Origine blog.csdn.net/weixin_46398647/article/details/124469828
conseillé
Classement