Deep-Learning-Bildrauschunterdrückung

Bildrauschen war in den letzten Monaten immer mein größtes Problem im Projekt. Eine gute und schnelle Methode zur Rauschunterdrückung zu finden, spielt eine Schlüsselrolle für den Fortschritt und das Endergebnis des Projekts. In den letzten Jahren ist auch die Rauschunterdrückung durch tiefes Lernen eine beliebte Richtung mit vielen bemerkenswerten Forschungsergebnissen. Ich fand es sehr interessant, eines der Entrauschungspapiere zu reproduzieren. Ich brauchte keine sauberen Daten, aber ich habe schließlich ein Entrauschungsmodell trainiert. (Weil es mühsam ist, in einem tatsächlichen Projekt ein rauschfreies Bild zu erhalten).

Ursprung des Bildrauschens:

Bildrauschen wird von der Kamera bei der Signalerfassung oder Signalübertragung verursacht und steht im Zusammenhang mit Artefakten. Es manifestiert sich im Bild als Farbfleck oder Helligkeitsfleck.

Traditionelle gängige Filtermethoden:

Für unterschiedliche Geräusche gibt es einige praktische Filtermethoden.

Mittelwertfilterung: Die Mittelwertfilterung wird auch als lineare Filterung bezeichnet, und die hauptsächlich verwendete Methode ist die Nachbarschaftsmittelungsmethode. Diese Methode kann das Bild mit hoher Geschwindigkeit und einem einfachen Algorithmus glätten. Der Lärm lässt sich zwar nicht entfernen, aber der Einfluss des Lärms kann abgeschwächt werden.
Medianfilterung: Die Medianfilterung ist eine nichtlineare Glättungstechnik, die den Grauwert jedes Pixels auf den Medianwert der Grauwerte aller Pixel in einem bestimmten Nachbarschaftsfenster des Punktes setzt. Diese Methode kann zum Schutz von Kanteninformationen verwendet werden, ist eine klassische Methode zum Glätten von Rauschen und ist sehr effektiv bei der Beseitigung von Salz- und Pfefferrauschen.
Gaußscher Filter: Der Gaußsche Filter ist ein linearer Filter, der Rauschen wirksam unterdrücken und Bilder glätten kann. Es eignet sich zum Filtern des Gaußschen weißen Rauschens und wird häufig in der Vorverarbeitungsphase der Bildverarbeitung verwendet.
Bilaterale Filterung: Bilaterale Filterung ist ein Filter, der Kanten bewahren und Rauschen reduzieren kann.

Deep-Learning-Filterung:

Das traditionelle Entrauschen neuronaler Netze, das klassischste ist der Entrauschungs-Selbstcodierer. Um die Entrauschung und Wiederherstellung von Bildern zu erreichen, besteht der Schlüssel darin, ein reines Bild zu erhalten und durch Training die Rauscheigenschaften zu erlernen, um die Fähigkeit zur Wiederherstellung zu haben Rauschbild. Die Fähigkeit, ein sauberes Bild darzustellen.

Heutiges Noise2Noise erfordert kein reines Bild, das heißt, durch Eingabe eines Rauschbilds ist die Beschriftung auch ein Bild, das Rauschen enthält. Durch Training können die Eigenschaften des Rauschens ermittelt werden, um den Filtereffekt zu erzielen.

Wenn es nur wenige Trainingsbeispiele gibt, kann er nur die Transformation zwischen den beiden lernen. Wenn die Trainingsmuster jedoch eine bestimmte Menge erreichen, kann das Netzwerk das echte reine Bild lernen, da das Rauschen nicht messbar ist.

In der Originalarbeit wurden mehrere Versuchsreihen durchgeführt, darunter Gaußsche Rauschentfernung, Poisson-Rauschenentfernung, Bernoulli-Rauschenentfernung, Wasserzeichenentfernung usw.

Code-Reproduktion Dieser Artikel wird meine Reproduktion nicht mehr bereitstellen, da Nvidia Open-Source-Code auf Github bereitstellt, https://github.com/NVlabs/noise2noise. Interessierte Freunde können den Quellcode sorgfältig lesen. Es ist ein sehr interessanter Artikel, der bei der Rauschunterdrückung viel bewirken kann.

Der Rauschunterdrückungseffekt, den ich reproduziert habe:

Original Bild:

Lärmkarte:

Rauschunterdrückungskarte:

Deep-Learning-Bildrauschunterdrückung

Supongo que te gusta