Erklärung des Befehls nvidia-smi

Allgemeine Befehle: watch -n 1 nvidia-smi GPU in Echtzeit anzeigen

1 Einführung in NVIDIA-SMI

        nvidia-smi, kurz NVSMI, bietet Funktionen zur Überwachung der GPU-Nutzung und zur Änderung des GPU-Status. Es handelt sich um ein plattformübergreifendes Tool, das Linux-Distributionen unterstützt, die von allen Standard-NVIDIA-Treibern und 64-Bit-Systemen ab Windows Server 2008 R2 unterstützt werden.Dieses Tool ist im N-Card-Treiber enthalten. Solange der Treiber installiert ist, ist er verfügbar.

    Programmspeicherort unter Windows: C: \ Programme \ NVIDIA Corporation \ NVSMI \ nvidia-smi.exe. Der Speicherort des Programms unter Linux: / usr / bin / nvidia-smi. Da der Speicherort dem Pfad PATH hinzugefügt wurde, können Sie nvidia-smi direkt eingeben, um es auszuführen.

2 Detaillierte Erläuterung der NVIDIA-SMI-Befehlsreihe

2.1 nvidia-smi

Zeigt den aktuellen Informationsstatus aller GPUs an

In der angezeigten Tabelle:

Lüfter: Lüfterdrehzahl (0% -100%), N / A bedeutet kein Lüfter

Temp: GPU-Temperatur (zu hohe GPU-Temperatur führt zu einem Abfall der GPU-Frequenz)

Perf: Leistungsstatus von P0 (maximale Leistung) bis P12 (minimale Leistung)

Pwr: GPU-Stromverbrauch

Persistenz-M: Status im persistenten Modus (der persistente Modus verbraucht viel Energie, benötigt jedoch weniger Zeit, um eine neue GPU-Anwendung zu starten.)

Bus-ID: GPU-Bus, Domäne: Bus: Gerätefunktion

Disp.A: Anzeige aktiv, zeigt an, ob die GPU-Anzeige initialisiert ist

Speichernutzung: Speichernutzung

Volatile GPU-Util: GPU-Nutzung

ECC: Gibt an, ob die Fehlerprüfungs- und Korrekturtechnologie aktiviert werden soll: 0 / DISABLED, 1 / ENABLED

Berechnen Sie M .: Berechnungsmodus, 0 / DEFAULT, 1 / EXCLUSIVE_PROCESS, 2 / PROHIBITED

 

Zusätzliche Optionen:

nvidia-smi –i xxx

Geben Sie eine GPU an

nvidia-smi –l xxx

Informationen zur dynamischen Aktualisierung (Standardaktualisierung alle 5 Sekunden): Drücken Sie Strg + C, um den Vorgang zu stoppen. Sie können die Aktualisierungshäufigkeit in Sekunden angeben

nvidia-smi –f xxx

Geben Sie die Abfrageinformationen in eine bestimmte Datei aus, die nicht im Terminal angezeigt wird

2.2 nvidia-smi -q

Fragen Sie die aktuellen Detailinformationen aller GPUs ab

Zusätzliche Optionen:

nvidia-smi –q –u

Anzeigeeinheit anstelle von GPU-Eigenschaften

nvidia-smi –q –i xxx

Geben Sie bestimmte GPU- oder Geräteinformationen an

nvidia-smi –q –f xxx

Geben Sie die Abfrageinformationen in eine bestimmte Datei aus, die nicht im Terminal angezeigt wird

nvidia-smi –q –x

Geben Sie die Abfrageinformationen als XML aus

nvidia-smi -q –d xxx

Gibt an, dass bestimmte Informationen der GPU-Karte angezeigt werden sollen. Der Parameter xxx kann MEMORY, UTILIZATION, ECC, TEMPERATURE, POWER, CLOCK, COMPUTE, PIDS, PERFORMANCE, SUPPORTED_CLOCKS, PAGE_RETIREMENT, ACCOUNTING sein

nvidia-smi –q –l xxx

Informationen zur dynamischen Aktualisierung: Drücken Sie Strg + C, um die Aktualisierung zu beenden. Sie können die Aktualisierungsfrequenz in Sekunden angeben

 

 

nvidia-smi --query-gpu = gpu_name, gpu_bus_id, vbios_version - format = csv

Bei selektiven Abfrageoptionen können Sie die angezeigten Attributoptionen angeben

Folgende Eigenschaften können angezeigt werden: Zeitstempel, Treiberversion, pci.bus, pcie.link.width.current usw. (Sie können nvidia-smi - help-query - gpu überprüfen, um zu sehen, welche Attribute)

 

2.3 Optionen zur Geräteänderung

Sie können die Statusoptionen des GPU-Kartengeräts manuell festlegen

nvidia-smi –pm 0/1

Stellen Sie den permanenten Modus ein: 0 / DISABLED, 1 / ENABLED

nvidia-smi –e 0/1

Switch-ECC-Unterstützung: 0 / DISABLED, 1 / ENABLED

nvidia-smi –p 0/1

ECC-Fehleranzahl zurücksetzen: 0 / VOLATILE, 1 / AGGREGATE

nvidia-smi –c

Stellen Sie den Berechnungsanwendungsmodus ein: 0 / DEFAULT, 1 / EXCLUSIVE_PROCESS, 2 / PROHIBITED

nvidia-smi –r

GPU zurückgesetzt

nvidia-smi –vm

Stellen Sie den GPU-Virtualisierungsmodus ein

nvidia-smi –ac xxx, xxx

Stellen Sie die Arbeitsfrequenz der GPU ein. zB nvidia-smi --ac2000,800

nvidia-smi –rac

Setzen Sie die Taktfrequenz auf die Standardeinstellung zurück

nvidia-smi –acp 0/1

Berechtigungsanforderungen für das Umschalten zwischen -ac und -rac, 0 / UNRESTRICTED, 1 / RESTRICTED

nvidia-smi-pl

Geben Sie die maximale Energieverwaltungsgrenze (Watt) an.

nvidia-smi –am 0/1

Aktivieren oder Deaktivieren des Zählmodus, 0 / DEAKTIVIERT, 1 / AKTIVIERT

nvidia-smi - caa

Löschen Sie alle aufgezeichneten PIDs im Puffer, 0 / DISABLED, 1 / ENABLED

 

2,4 nvidia-smi dmon

Geräteüberwachungsbefehle zeigen GPU-Gerätestatistiken in Form von Bildlaufleisten an.

GPU-Statistiken werden in einem einzeiligen Bildlaufformat angezeigt, und die zu überwachenden Anzeigen können basierend auf der Breite des Terminalfensters angepasst werden. Überwachen Sie bis zu 4 GPUs. Wenn keine GPU angegeben ist, überwachen Sie standardmäßig GPU0-GPU3 (GPU-Index beginnt bei 0).

Zusätzliche Optionen:

nvidia-smi dmon –i xxx

Separater GPU-Index, PCI-Bus-ID oder UUID mit Komma

nvidia-smi dmon –d xxx

Geben Sie die Aktualisierungszeit an (Standard ist 1 Sekunde).

nvidia-smi dmon –c xxx

Zeigen Sie die angegebene Anzahl von Statistiken an und beenden Sie das Programm

nvidia-smi dmon –s xxx

Geben Sie an, welche Überwachungsindikatoren angezeigt werden sollen (Standard ist puc), wobei:

p: Stromverbrauch und Temperatur (pwr: Stromverbrauch, Temperatur: Temperatur)

u: GPU-Nutzung (sm: Stream-Prozessor, mem: Videospeicher, enc: Codierungsressourcen, dec: Decodierungsressourcen)

c: Taktfrequenz des GPU-Prozessors und des GPU-Speichers (mclk: Videospeicherfrequenz, pclk: Prozessorfrequenz)

v: Anormale Leistung und Hitze

m: FB-Speicher und Bar1-Speicher

e: Anzahl der ECC-Fehler und PCIe-Redisplay-Fehler

t: PCIe-Lese- und Schreibbandbreite

nvidia-smi dmon –o D / T.

Geben Sie das angezeigte Zeitformat D: JJJJMMTT, THH: MM: SS an

nvidia-smi dmon –f xxx

Geben Sie die Abfrageinformationen in eine bestimmte Datei aus, die nicht im Terminal angezeigt wird

 

2,5 nvidia-smi pmon

Prozessüberwachungsbefehl zum Anzeigen von GPU-Prozessstatusinformationen in Form einer Bildlaufleiste.

Die GPU-Prozessstatistiken werden in einem einzeiligen Bildlaufformat angezeigt. Dieses Tool listet die Statistiken aller GPU-Prozesse auf. Die zu überwachenden Anzeigen können basierend auf der Breite des Terminalfensters angepasst werden. Überwachen Sie bis zu 4 GPUs. Wenn keine GPU angegeben ist, überwachen Sie standardmäßig GPU0-GPU3 (GPU-Index beginnt bei 0).

Zusätzliche Optionen:

nvidia-smi pmon –i xxx

Separater GPU-Index, PCI-Bus-ID oder UUID mit Komma

nvidia-smi pmon –d xxx

Geben Sie die Aktualisierungszeit an (Standard ist 1 Sekunde, maximal 10 Sekunden).

nvidia-smi pmon –c xxx

Zeigen Sie die angegebene Anzahl von Statistiken an und beenden Sie das Programm

nvidia-smi pmon –s xxx

Geben Sie an, welche Überwachungsindikatoren angezeigt werden sollen (Standard ist u), wobei:

u: GPU-Nutzung

m: FB-Speichernutzung

nvidia-smi pmon –o D / T.

Geben Sie das angezeigte Zeitformat D: JJJJMMTT, THH: MM: SS an

nvidia-smi pmon –f xxx

Geben Sie die Abfrageinformationen in eine bestimmte Datei aus, die nicht im Terminal angezeigt wird

2.6  nvidia-smi aktualisiert und hebt den Status in Echtzeit hervor

beobachte -n 1 -d nvidia-smi

 

 

Veröffentlicht 63 Originalartikel · Gelobt 7 · Aufrufe 3396

Ich denke du magst

Origin blog.csdn.net/weixin_44523062/article/details/105118053
Empfohlen
Rangfolge