Der spezifische Betriebsprozess des Cloud-GPU-Trainings (Hengyuan-Cloud [nicht empfohlen]).

Einführung

In diesem Blog geht es hauptsächlich um die Verwendung der GPU auf dem Cloud-Server zum Ausführen des Programms, hauptsächlich um einige Einstellungen und Betriebsschritte.Für spezifische Trainingsschritte können Sie meinen anderen Blog sehen.

Es kann Auslassungen in den folgenden Schritten geben oder einige Unterschiede zu Ihren. Wenn Sie Fragen haben, kommentieren Sie diese bitte oder senden Sie eine private Nachricht.

Lassen Sie mich zuerst über die Umgebung sprechen , das Computerbetriebssystem ist win10, die Cloud-Server-Plattform verwendet Hengyuan Cloud und die IDE verwendet die professionelle Version von Pycharm (Version 2022.1.3, beachten Sie, dass die Community-Version den Cloud-Server nicht verwenden kann , Studenten können Bewerben Sie sich kostenlos für die Professional-Version, bestimmte Schritte beschreiben andere Blogs auf CSDN ausführlich), das Server-Betriebssystem ist Linux.

Cloud-Plattform

Ich habe mich vorher für Hengyuan Cloud entschieden, aber festgestellt, dass die überarbeitete Version immer schwieriger zu bedienen ist. Jetzt bin ich auf autodl umgestiegen , und der Preis ist recht günstig. Die Studentenpartei-Zertifizierung ist Mitglied. Allerdings ist die Dokumentation von autodl nicht so einfach zu bedienen wie die von Hengyuan Cloud. ​​​​​​​​

Betrieb der Cloud-Plattform

Wählen Sie die zu verwendende GPU aus

 Das obige Bild ist die Cloud-Markt-Schnittstelle, die linke Seite kann zum Filtern von GPU-Modellen verwendet werden, und die rechte Seite zeigt verfügbare GPUs. Sie ist unterteilt in Gutscheine, Hochverfügbarkeit und Aktivitäten, wobei die beiden letzteren Bargeld erfordern.Diese Demonstration nutzt den Gutscheinbereich zur Demonstration.

Das obige Bild ist die Benutzeroberfläche nach dem Klicken auf Miete, und es gibt spezifische Einführungen im Bild. Es sollte beachtet werden, dass das Training fehlschlägt, wenn das Bild dasselbe ist, aber die GPU unterschiedlich ist (ich bin auf dieses Problem gestoßen, und der Grund ist nicht besonders klar, es kann ein Problem mit dem Bild sein).

Nachdem die Instanz erfolgreich erstellt wurde, öffnen Sie meine Instanz und Sie können die folgende Oberfläche sehen. Hier werde ich die Instanz verwenden, die ich zuvor erstellt habe, um sie anzuzeigen. Einige grundlegende Informationen wurden auf dem Bild markiert. Der nächste Schritt besteht darin, die Instanz zu starten, sie über die Instanzverwaltungsschaltfläche einzuschalten und sich zu beeilen.

? ? ? Fragezeichengesicht (nicht mehr, kein Geld, Ende hier)

Nachdem ich es mir angesehen hatte, wurde plötzlich klar, dass Sie nur mit echtem Geld bezahlen können. Fügen Sie einen weiteren Nachteil hinzu, der eigentlich dem ersten Nachteil ähnelt. Die Änderungen sind zu häufig. Sie können den Gutschein für eine Weile verwenden und dann können Sie es. t. Wieder einen gemietet.

 

Ok, das Lease ist erfolgreich, die Oberfläche ist nach dem Start wie oben gezeigt, und dann konfigurieren Sie pycharm.

pycharm-Konfiguration

Öffnen Sie die Einstellungen, klicken Sie auf den Python-Interpreter und fügen Sie über das Zahnrad auf der rechten Seite einen neuen Interpreter hinzu (es gibt zwei Möglichkeiten, einen Server hinzuzufügen, und die andere besteht darin, über Tools/Tools in der Menüleiste zu arbeiten).

ssh -p 45269 [email protected] Die Portnummer ist 45269, der Benutzername ist root, der Host ist i-2.gpushare.com, füllen Sie aus und klicken Sie auf OK, um eine Verbindung herzustellen.

Geben Sie das Passwort ein und denken Sie daran, das Passwort für die nächste Verbindung zu speichern.

Der Python-Interpreter auf dem Server ist standardmäßig eingestellt, und der Remote-Pfad wird wie folgt geändert. 

Hinweis: Es wird empfohlen, das Projekt manuell hochzuladen (unten beschrieben), und der Remote-Pfad muss möglicherweise ein zweites Mal für den automatischen Upload geändert werden.

Nachdem die Auswahl abgeschlossen ist, klicken Sie auf OK und fahren Sie dann ohne nachzudenken mit dem nächsten Schritt fort.

Die obige Oberfläche wird angezeigt, dh die Konfiguration ist erfolgreich. Klicken Sie auf Übernehmen und bestätigen Sie.

Nachdem Sie zur pycharm-Oberfläche zurückgekehrt sind, sehen Sie das obige Bild in der unteren rechten Ecke der Unterseite. Die rechte Seite ist der konfigurierte Remote-Python-Interpreter und die linke Seite ist der Server. Sie müssen diese beiden eins-zu-eins machen eine Korrespondenz. Wenn sie nicht übereinstimmen, können Sie den Server ändern. Klicken Sie einfach auf Revised to 45269.

Nach erfolgreicher Einrichtung des Servers werden der Interpreter und das auf dem Server heruntergeladene Softwarepaket im Hintergrund aktualisiert.Wenn der automatische Upload eingestellt ist, wird auch der Code automatisch hochgeladen (wenn der Datensatz im Projekt ist, wird dies der Fall sein). auch zusammen hochgeladen werden, was Upload-Zeit verursacht Es ist sehr lang, es wird im Allgemeinen nicht empfohlen, Daten auf diese Weise hochzuladen, Sie können es über os hochladen, siehe unten)

 Wenn der automatische Upload nicht eingestellt ist, laden Sie die Dateien manuell auf den Server hoch, indem Sie wie oben gezeigt mit der rechten Maustaste auf das Projektstammverzeichnis klicken. Nachdem der Upload erfolgreich war, können Sie auf jupyterlab klicken, um die Datei über die Hengyuan Cloud-Webseite anzuzeigen.

Sie können die hochgeladenen Dateien sehen, da kein Datensatz vorhanden ist, sodass die Geschwindigkeit sehr schnell ist.

An dieser Stelle ist die Pycharm-Konfiguration grundsätzlich abgeschlossen.

Daten hochladen

 Das Hochladen von Hengyuan-Cloud-Daten verwendet verschiedene Methoden wie oss. Es wird empfohlen, oss zum Hochladen zu verwenden. Laden Sie zuerst oss ​​auf das lokale herunter.

 

 Nachdem der Download abgeschlossen ist, öffnen Sie oss.exe, geben Sie login ein, um sich anzumelden, geben Sie die Kontonummer und das Passwort von Hengyuan Cloud ein, und die Anmeldung ist erfolgreich

Daten hochladen, beachten Sie, dass nur komprimierte Pakete hochgeladen werden können.

 Laden Sie die DOTA-Datensatz-Anmerkungsdatei auf dem Laufwerk c in den DOTA-Ordner in oss über den Befehl in der obigen Abbildung hoch, wie in der folgenden Abbildung gezeigt.

Kopieren Sie den Datensatz im persönlichen Datenverzeichnis über das Terminal in pycharm oder jupyterlab in das /hy-tmp-Verzeichnis. Hier ist die Terminalimplementierung von jupyterlab, melden Sie sich zuerst an und kopieren Sie dann die Datei über die Befehlszeile in das Verzeichnis hy-tmp, wie in der folgenden Abbildung gezeigt.

 Erstellen Sie dann ein Verzeichnis mydata, um die dekomprimierten Dateien zu speichern, und dekomprimieren Sie den Datensatz in den Ordner mydata.

 Bis jetzt sind pycharm und der Server konfiguriert, nachdem Sie den Code geändert und auf den Server hochgeladen haben, können Sie ihn per Klick in pycharm ausführen (beachten Sie die Umgebungsanforderungen in der requirements.txt). Wenn das Programm einen Fehler meldet, können Sie meinen anderen Blog lesen, es kann an einigen Einstellungen liegen oder das Paket ist nicht installiert.

YOLOv7 verwendet Cloud-GPU, um seinen eigenen Datensatz zu trainieren https://blog.csdn.net/weixin_43764678/article/details/125863456?spm=1001.2014.3001.5501

 Sollten im Artikel Fehler sein, bitte ich um Mitteilung.

Ich denke du magst

Origin blog.csdn.net/weixin_43764678/article/details/126029879
Empfohlen
Rangfolge