Version du système : CentOS 7.9.2009
Version du noyau : Linux localhost.localdomain 3.10.0-1160.el7.x86_64 #1 SMP lundi 19 octobre 16:18:59 UTC 2020 x86_64 x86_64 x86_64 GNU/Linux
1. Installer les dépendances
yum -y install epel-release
yum -y install gcc binutils wget
yum -y install kernel-devel
2. Désactivez Nouveau
2.1. Vérifiez si Nouveau est activé
lsmod | grep nouveau
Remarque : Aucune sortie d'information signifie qu'elle a été désactivée. Il n'est pas nécessaire d'effectuer les étapes suivantes ;
2.2. Modifier la configuration
echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist.conf
2.3.Sauvegarde img
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
2.4.Reconstruire
dracut /boot/initramfs-$(uname -r).img $(uname -r)
2.5. Redémarrez le système
reboot
2.6. Vérifiez s'il est fermé
lsmod | grep nouveau
Remarque : Aucune sortie d'information n'indique une désactivation réussie ;
3. Vérifiez le pilote
3.1. Installer les sources d'elrepo
rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-4.el7.elrepo.noarch.rpm
ou
yum -y install https://www.elrepo.org/elrepo-release-7.0-4.el7.elrepo.noarch.rpm
3.2. Installer nvidia-detect
yum -y install nvidia-detect
3.3. Détecter le pilote de la carte graphique
nvidia-detect -v
Recherche des appareils NVIDIA pris en charge…
[10de:1b06] NVIDIA Corporation GP102 [GeForce GTX 1080 Ti]
Cet appareil nécessite le pilote NVIDIA 510.60.02 actuel kmod-nvidia
4. Installation du pilote
4.1. Télécharger le pilote
wget https://us.download.nvidia.cn/XFree86/Linux-x86_64/510.68.02/NVIDIA-Linux-x86_64-510.68.02.run
Remarque : S'il est détecté que le numéro de version est incompatible avec le mien, vous pouvez remplacer la pièce vous-même.
Suggestion : téléchargez-le sur une clé USB depuis le site officiel de NVIDIA et copiez-le sur le serveur.
Remarque : Nvidia ne fournira que la dernière version, qui est rétrocompatible, donc ce que j'ai installé ici est 510.68.02, pas 510.60.02.
4.2.Autorisation
chmod +x NVIDIA-Linux-x86_64-510.68.02.run
Une erreur sera signalée ici et le service X devra être fermé.
Vérifiez s'il s'agit de gdm (il existe deux types, celui-ci sans serveur appartient à gdm)
systemctl --all|grep gdm
whereis gdm
systemctl stop gdm.service
installer le pilote
systemctl start gdm.service
4.3.Installation
sh ./NVIDIA-Linux-x86_64-510.68.02.run -s
4.4. Afficher les informations de la carte graphique
nvidia-smi
Remarque : les informations affichées indiquent que le pilote de la carte graphique a été installé.
De plus : j'ai également installé
python 3.9.11
pytorch1.11.0
tensorflow-gpu 2.7.0
transformers 4.18.0
cuda 11.3
cudnn 8.2.0
, qui sont tous les dernières versions et je l'ai essayé avec succès.
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 510.68.02 Driver Version: 510.68.02 CUDA Version: 11.6 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 NVIDIA GeForce ... Off | 00000000:01:00.0 On | N/A |
| 49% 82C P2 246W / 250W | 8944MiB / 11264MiB | 99% Default |
| | | N/A |
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| 0 N/A N/A 10400 G /usr/bin/X 84MiB |
| 0 N/A N/A 23147 G /usr/bin/gnome-shell 84MiB |
| 0 N/A N/A 29312 C python 8771MiB |
+-----------------------------------------------------------------------------+
5. Désinstallez le pilote
5.1. Désinstaller et installer
nvidia-uninstall
5.2. Installation propre
dkms remove
Remarque : il faut installer "yum -y install dkms"
6. Erreurs courantes
1.安装时报错 « ERREUR : Impossible de trouver l'arborescence des sources du noyau pour le noyau en cours d'exécution. Veuillez vous assurer que vous avez installé les fichiers sources du noyau et qu'ils sont correctement configurés ; sur les systèmes Red Hat Linux, par exemple, assurez-vous que le RPM « kernel-source » ou « kernel-devel » est installé. Si vous savez que les fichiers sources du noyau corrects sont installés, vous pouvez spécifier le chemin source du noyau avec l'option de ligne de commande « –kernel-source-path ».
Solution:
Installer les bibliothèques du noyau
yum -y install epel-release
yum -y install kernel-devel
Comparaison des versions du noyau
rpm -qa |grep kernel
uname -r
installer le pilote
./NVIDIA-Linux-x86_64-510.68.02.run --kernel-source-path=/usr/src/kernels/3.10.0-1160.42.2.el7.x86_64 -k $(uname -r)