Reproduktion des DETR-Modellcodes des Facebook-KI-Teams

DETR-Wiederholung: Es reproduziert das vom Facebook AI-Team im Jahr 2020 veröffentlichte Papier „End-to-End Object Detection with Transformers“, das als DETR-Modell bezeichnet wird. Der offizielle Quellcode stellt nur Trainings- und Bewertungsquellcode bereit. Auf dieser Grundlage habe ich hinzugefügt der Vorhersagecode, der nun vollständig ist. Der Code wurde durchlaufen und ist Open Source und darf nur zum Lernen verwendet werden.

Alle Codes sind oben aufgeführt, Sie können sie selbst erhalten.

1. Laden Sie zuerst den offiziellen Quellcode herunter, fügen Sie mehrere .py-Dateien in der oben verlinkten Gitte hinzu und öffnen Sie sie in Pycharm.

 2. Konfigurieren Sie Ihre eigene Umgebung, einschließlich Cuda, Pakete usw. Weitere Informationen finden Sie in den Dateianforderungen. Es ist zu beachten, dass es zwei Pakete gibt, die den Coco-Datensatz laden, und die im Allgemeinen schwierig zu installieren sind. Ich habe das Paket abgelegt Klicken Sie auf den Link oben, Gitte, und führen Sie ihn im Terminal aus. setup.py wird den Zweck erfüllen

3. Laden Sie den Coco-Datensatz herunter. Nachdem der Download abgeschlossen ist, können Sie subset.py herunterladen, um Ihren eigenen heruntergetasteten Coco-Datensatz für das Training zu generieren (der Originaldatensatz ist zu groß, 1 % Stichprobe wird empfohlen) oder labelme verwenden Erstellen Sie Ihren eigenen Datensatz.

4. Um das Gewicht zu ändern, laden Sie zuerst das Resnet50-Modell vom offiziellen Github herunter und laden Sie dann Weight.py in My Gitte herunter. Sie müssen nur zwei Parameter ändern: eine .pth-Datei von Resnet50 und die Anzahl Ihrer eigenen Kategorien Datensatz. Wenn es sich um ein Downsampling handelt, schreiben Sie 92. Dann generieren Sie Ihre eigene Gewichtsdatei.pth

 5. Starten Sie das Training. Das Facebook-KI-Team hat für 300 Epochen trainiert. Es wird empfohlen, den Wert auf 100 zu ändern. Ändern Sie den Speicherort Ihres Datensatzes train2017 und val2017 sowie den Pfad der Anmerkungsdatei. Ändern Sie den Pfad Ihrer Gewichtsdatei und beginnen Sie Training. Nach Abschluss des Trainings wird die Ausgabe generiert. Welche Datei sollten Sie für Ihr eigenes Trainingsmodell überprüfen und sich dessen Pfad merken?

 5. Fügen Sie die Datei „predict.py“ in die Hauptdatei ein und passen Sie den Pfad Ihres heruntergerechneten Coco-Datensatzes, den Pfad des Trainingsmodells, den Pfad des vorhergesagten Bilds und den Pfad des gespeicherten Bilds an. Die von mir geschriebene Vorhersagedatei kann Bilder stapelweise verarbeiten.

Ich habe dies auf meinem Mobiltelefon bearbeitet, also habe ich keine Bilder eingefügt. Ich habe Kommentare zu den Teilen hinzugefügt, die im Code geändert werden müssen. Sie befinden sich auch in den Referenzartikeln. Sie sind ziemlich gleich. Unten ist der Bildschirm Aufzeichnung meines Schulungsabschlusses. Wenn Sie Fragen haben, können Sie einen Kommentar abgeben. Forumsdiskussionen und private Nachrichten, ich werde antworten, sobald ich sie sehe.

 

Referenzartikel:

DETR trainiert seinen eigenen Datensatz-CSDN-Blog

[DETR] Trainieren Sie Ihren eigenen Datensatz – Übungsnotizen_detr Trainingsvolumen_Mu Jishens Blog – CSDN-Blog

Windows 10 reproduziert DEtection TRansformers (DETR) und implementiert seine eigene Datensatz_detr-Reproduktion – CSDN-Blog

Video zur Reproduktion des DERT-Modells

Supongo que te gusta

Origin blog.csdn.net/weixin_51345015/article/details/134451939
Recomendado
Clasificación