Übertragung von https://blog.csdn.net/handsome_bear/article/details/80903477
Allgemeine Befehle: watch -n 1 nvidia-smi GPU in Echtzeit anzeigen
1 Einführung in NVIDIA-SMI
nvidia-smi, kurz NVSMI, bietet Funktionen zur Überwachung der GPU-Nutzung und zur Änderung des GPU-Status. Es handelt sich um ein plattformübergreifendes Tool, das Linux-Distributionen unterstützt, die von allen Standard-NVIDIA-Treibern und 64-Bit-Systemen ab Windows Server 2008 R2 unterstützt werden.Dieses Tool ist im N-Card-Treiber enthalten. Solange der Treiber installiert ist, ist er verfügbar.
Programmspeicherort unter Windows: C: \ Programme \ NVIDIA Corporation \ NVSMI \ nvidia-smi.exe. Der Speicherort des Programms unter Linux: / usr / bin / nvidia-smi. Da der Speicherort dem Pfad PATH hinzugefügt wurde, können Sie nvidia-smi direkt eingeben, um es auszuführen.
2 Detaillierte Erläuterung der NVIDIA-SMI-Befehlsreihe
2.1 nvidia-smi
Zeigt den aktuellen Informationsstatus aller GPUs an
In der angezeigten Tabelle:
Lüfter: Lüfterdrehzahl (0% -100%), N / A bedeutet kein Lüfter
Temp: GPU-Temperatur (zu hohe GPU-Temperatur führt zu einem Abfall der GPU-Frequenz)
Perf: Leistungsstatus von P0 (maximale Leistung) bis P12 (minimale Leistung)
Pwr: GPU-Stromverbrauch
Persistenz-M: Status im persistenten Modus (der persistente Modus verbraucht viel Energie, benötigt jedoch weniger Zeit, um eine neue GPU-Anwendung zu starten.)
Bus-ID: GPU-Bus, Domäne: Bus: Gerätefunktion
Disp.A: Anzeige aktiv, zeigt an, ob die GPU-Anzeige initialisiert ist
Speichernutzung: Speichernutzung
Volatile GPU-Util: GPU-Nutzung
ECC: Gibt an, ob die Fehlerprüfungs- und Korrekturtechnologie aktiviert werden soll: 0 / DISABLED, 1 / ENABLED
Berechnen Sie M .: Berechnungsmodus, 0 / DEFAULT, 1 / EXCLUSIVE_PROCESS, 2 / PROHIBITED
Zusätzliche Optionen:
nvidia-smi –i xxx
Geben Sie eine GPU an
nvidia-smi –l xxx
Informationen zur dynamischen Aktualisierung (Standardaktualisierung alle 5 Sekunden): Drücken Sie Strg + C, um den Vorgang zu stoppen. Sie können die Aktualisierungshäufigkeit in Sekunden angeben
nvidia-smi –f xxx
Geben Sie die Abfrageinformationen in eine bestimmte Datei aus, die nicht im Terminal angezeigt wird
2.2 nvidia-smi -q
Fragen Sie die aktuellen Detailinformationen aller GPUs ab
Zusätzliche Optionen:
nvidia-smi –q –u
Anzeigeeinheit anstelle von GPU-Eigenschaften
nvidia-smi –q –i xxx
Geben Sie bestimmte GPU- oder Geräteinformationen an
nvidia-smi –q –f xxx
Geben Sie die Abfrageinformationen in eine bestimmte Datei aus, die nicht im Terminal angezeigt wird
nvidia-smi –q –x
Geben Sie die Abfrageinformationen als XML aus
nvidia-smi -q –d xxx
Gibt an, dass bestimmte Informationen der GPU-Karte angezeigt werden sollen. Der Parameter xxx kann MEMORY, UTILIZATION, ECC, TEMPERATURE, POWER, CLOCK, COMPUTE, PIDS, PERFORMANCE, SUPPORTED_CLOCKS, PAGE_RETIREMENT, ACCOUNTING sein
nvidia-smi –q –l xxx
Informationen zur dynamischen Aktualisierung: Drücken Sie Strg + C, um die Aktualisierung zu beenden. Sie können die Aktualisierungsfrequenz in Sekunden angeben
nvidia-smi --query-gpu = gpu_name, gpu_bus_id, vbios_version - format = csv
Bei selektiven Abfrageoptionen können Sie die angezeigten Attributoptionen angeben
Folgende Eigenschaften können angezeigt werden: Zeitstempel, Treiberversion, pci.bus, pcie.link.width.current usw. (Sie können nvidia-smi - help-query - gpu überprüfen, um zu sehen, welche Attribute)
2.3 Optionen zur Geräteänderung
Sie können die Statusoptionen des GPU-Kartengeräts manuell festlegen
nvidia-smi –pm 0/1
Stellen Sie den permanenten Modus ein: 0 / DISABLED, 1 / ENABLED
nvidia-smi –e 0/1
Switch-ECC-Unterstützung: 0 / DISABLED, 1 / ENABLED
nvidia-smi –p 0/1
ECC-Fehleranzahl zurücksetzen: 0 / VOLATILE, 1 / AGGREGATE
nvidia-smi –c
Stellen Sie den Berechnungsanwendungsmodus ein: 0 / DEFAULT, 1 / EXCLUSIVE_PROCESS, 2 / PROHIBITED
nvidia-smi –r
GPU zurückgesetzt
nvidia-smi –vm
Stellen Sie den GPU-Virtualisierungsmodus ein
nvidia-smi –ac xxx, xxx
Stellen Sie die Arbeitsfrequenz der GPU ein. zB nvidia-smi --ac2000,800
nvidia-smi –rac
Setzen Sie die Taktfrequenz auf die Standardeinstellung zurück
nvidia-smi –acp 0/1
Berechtigungsanforderungen für das Umschalten zwischen -ac und -rac, 0 / UNRESTRICTED, 1 / RESTRICTED
nvidia-smi-pl
Geben Sie die maximale Energieverwaltungsgrenze (Watt) an.
nvidia-smi –am 0/1
Aktivieren oder Deaktivieren des Zählmodus, 0 / DEAKTIVIERT, 1 / AKTIVIERT
nvidia-smi - caa
Löschen Sie alle aufgezeichneten PIDs im Puffer, 0 / DISABLED, 1 / ENABLED
2,4 nvidia-smi dmon
Geräteüberwachungsbefehle zeigen GPU-Gerätestatistiken in Form von Bildlaufleisten an.
GPU-Statistiken werden in einem einzeiligen Bildlaufformat angezeigt, und die zu überwachenden Anzeigen können basierend auf der Breite des Terminalfensters angepasst werden. Überwachen Sie bis zu 4 GPUs. Wenn keine GPU angegeben ist, überwachen Sie standardmäßig GPU0-GPU3 (GPU-Index beginnt bei 0).
Zusätzliche Optionen:
nvidia-smi dmon –i xxx
Separater GPU-Index, PCI-Bus-ID oder UUID mit Komma
nvidia-smi dmon –d xxx
Geben Sie die Aktualisierungszeit an (Standard ist 1 Sekunde).
nvidia-smi dmon –c xxx
Zeigen Sie die angegebene Anzahl von Statistiken an und beenden Sie das Programm
nvidia-smi dmon –s xxx
Geben Sie an, welche Überwachungsindikatoren angezeigt werden sollen (Standard ist puc), wobei:
p: Stromverbrauch und Temperatur (pwr: Stromverbrauch, Temperatur: Temperatur)
u: GPU-Nutzung (sm: Stream-Prozessor, mem: Videospeicher, enc: Codierungsressourcen, dec: Decodierungsressourcen)
c: Taktfrequenz des GPU-Prozessors und des GPU-Speichers (mclk: Videospeicherfrequenz, pclk: Prozessorfrequenz)
v: Anormale Leistung und Hitze
m: FB-Speicher und Bar1-Speicher
e: Anzahl der ECC-Fehler und PCIe-Redisplay-Fehler
t: PCIe-Lese- und Schreibbandbreite
nvidia-smi dmon –o D / T.
Geben Sie das angezeigte Zeitformat D: JJJJMMTT, THH: MM: SS an
nvidia-smi dmon –f xxx
Geben Sie die Abfrageinformationen in eine bestimmte Datei aus, die nicht im Terminal angezeigt wird
2,5 nvidia-smi pmon
Prozessüberwachungsbefehl zum Anzeigen von GPU-Prozessstatusinformationen in Form einer Bildlaufleiste.
Die GPU-Prozessstatistiken werden in einem einzeiligen Bildlaufformat angezeigt. Dieses Tool listet die Statistiken aller GPU-Prozesse auf. Die zu überwachenden Anzeigen können basierend auf der Breite des Terminalfensters angepasst werden. Überwachen Sie bis zu 4 GPUs. Wenn keine GPU angegeben ist, überwachen Sie standardmäßig GPU0-GPU3 (GPU-Index beginnt bei 0).
Zusätzliche Optionen:
nvidia-smi pmon –i xxx
Separater GPU-Index, PCI-Bus-ID oder UUID mit Komma
nvidia-smi pmon –d xxx
Geben Sie die Aktualisierungszeit an (Standard ist 1 Sekunde, maximal 10 Sekunden).
nvidia-smi pmon –c xxx
Zeigen Sie die angegebene Anzahl von Statistiken an und beenden Sie das Programm
nvidia-smi pmon –s xxx
Geben Sie an, welche Überwachungsindikatoren angezeigt werden sollen (Standard ist u), wobei:
u: GPU-Nutzung
m: FB-Speichernutzung
nvidia-smi pmon –o D / T.
Geben Sie das angezeigte Zeitformat D: JJJJMMTT, THH: MM: SS an
nvidia-smi pmon –f xxx
Geben Sie die Abfrageinformationen in eine bestimmte Datei aus, die nicht im Terminal angezeigt wird
2.6 nvidia-smi aktualisiert und hebt den Status in Echtzeit hervor
beobachte -n 1 -d nvidia-smi