PMS-Net: Robuste Haze-Entfernung basierend auf Patch Map für einzelne Bilder (robuste Dehazing basierend auf einer einzelnen Bildtextur)

Einführung:

In diesem Artikel wird ein neuartiger Algorithmus zur Trübungsentfernung vorgeschlagen, der auf einer Patch-Map basiert. Herkömmliche patchbasierte Dunstentfernungsalgorithmen (z. B. Dark Channel First) führen die Dunstentfernung normalerweise mit einer festen Patchgröße durch. Es kann jedoch zu Problemen wie Übersättigung und Farbverzerrung kommen. Daher entwerfen wir in diesem Artikel ein adaptives und automatisches Patchgrößen-Auswahlmodell namens Patch Map Selection Network (PMS-Net), um die entsprechende Patchgröße für jedes Pixel auszuwählen. Das Netzwerk basiert auf einem Faltungs-Neuronalen Netzwerk (CNN), das Patch-Karten aus Eingabebildern generieren kann. Experimentelle Ergebnisse an synthetischen und realen Bildern zeigen, dass in Kombination mit dem vorgeschlagenen PMS-Netzwerk die Leistung bei der Entfernung von Trübungen den modernsten Algorithmen weit überlegen ist und wir das durch die feste Patchgröße verursachte Problem lösen können.

Gesamtstruktur:

Flussdiagramm des vorgeschlagenen Rauchentfernungsalgorithmus:

Kernstrukturdiagramm: Hauptsächlich in zwei Teile unterteilt, Codierungsteil: Zuerst wird das Eingabebild durch einen 3 * 3-Filter16-Kanal-Faltungskern auf einen hochdimensionalen Raum abgebildet, und dann wird das Bild aus höherdimensionalen Daten extrahiert Multiskalen-U-Modul-Funktion. Dekodierungsteil: Verwenden Sie GCN zum Dekodieren und Upsampling, BR behält Bildgrenzeninformationen bei, und diese dichte Verbindung kann hochauflösende und niedrig auflösende Informationen kombinieren und schließlich eine bessere Patch-Karte erhalten.

 Die vorgeschlagene Multi-W-ResBlock- und Multi-Deconv-Blockstruktur: In jedem MSWR wird dieselbe Architektur (conv-BN-relu-dropout-conv-BN-relu) verwendet, sodass durch die Kombination mehrerer Architekturen nicht nur Details extrahiert werden können Informationen, und ein solches Netzwerk kann Übertragungskarten oder schleierfreie Bilder effizienter erhalten.

Datensätze: In dieser Arbeit werden der NYU- Depth2-Datensatz und der RESIDE-Datensatz verwendet. Während des Trainings werden insgesamt 2192 Bilder verwendet, darunter 1200 Bilder aus dem NYU-Depth2-Datensatz, 492 Bilder aus dem RESIDE-Datensatz und 500 synthetische Bilder als Trainingsdaten. Im Trainingsmodell beträgt die Lernrate e-4 und es wird der Adam-Optimierer verwendet. Die Stapelgröße ist auf 4 eingestellt und die Verlustfunktion ist der mittlere quadratische Fehler (MSE). In jeder Epoche verwenden wir ein frühes Stoppen und verwenden 10 % der Originaldaten als Validierungssatz. Ähnlich wie bei anderen Entnebelungsarbeiten verwenden wir für den Testdatensatz die verbleibenden Bilder in diesen Datensätzen als Testsatz. Nehmen Sie 150 Bilder aus dem NYU-Depth2-Datensatz auf und wenden Sie synthetischen Dunst auf diese Bilder als Test A an. Nehmen Sie 200 Außenbilder und 100 Innenbilder aus dem RESIDE-Datensatz und dem NYU-Depth2-Datensatz als Test B auf.

Die Ergebnisanzeige:

Qualitative Analyse des Test-A-Datensatzes:

Qualitative Analyse des Test-B-Datensatzes:

 

Acho que você gosta

Origin blog.csdn.net/zhangmeili_9/article/details/122728898
Recomendado
Clasificación