Die Bedeutung des Ersetzens vollständig verbundener Schichten durch Faltungsschichten (CNN und FCN)

Vollständig verbundene Schicht: CNN

Merkmale zur Klassifizierung zu integrieren und sie im Bild zu verkörpern bedeutet, zu wissen, dass sich eine Katze im Bild befindet, aber nicht zu wissen, wo sich die Katze befindet.

Bei herkömmlichen CNNs hat die Eingabe eine eindeutige Größe. Weil die vollständig verbundene Schicht eine feste Eingabe erfordert.

Vollständig Faltungsnetzwerk: FCN

Es kann nicht nur zur Klassifizierung verwendet werden, sondern auch zum Lokalisieren der klassifizierten Bildteile (durch Implementierung von Vorhersagen für jedes Pixel).

Es spielt auch eine wichtige Rolle, da die Größe des Eingabebilds nicht eingeschränkt wird.

Ersetzungsmethode: Ersetzen Sie die vollständig verbundene Schicht durch einen 1 * 1-Faltungskern + eine transponierte Faltungsschicht

Der 1*1-Faltungskern wird verwendet, um die Anzahl der Kanäle zu reduzieren. Viele Leute sagen, dass der 1 * 1-Faltungskern und die vollständig verbundene Schicht sehr ähnliche Funktionen haben, daher werden Bilder hier klassifiziert. Warum die Effekte gleich sind, habe ich noch nicht herausgefunden. Ich werde es nachholen, wenn ich es weiß.

Die transponierte Faltungsschicht wird zur Bildvergrößerung verwendet (die Pooling-Schicht reduziert die Dimension).

Ausgabe: Beschriftete Wärmekarte

Guess you like

Origin blog.csdn.net/qq_46012097/article/details/134259986
Recommended