Dieser Artikel bezieht sich hauptsächlich auf den zu organisierenden Blog von Jiang Dabai, listet mehrere persönliche Bedürfnisse auf und fügt einige neue Wissenspunkte zum Thema Computer hinzu.
1. Merkmale der Netzwerkstruktur
1.1 Eingabe
Mosaikdatenverbesserung
Die gleiche Datenverbesserungsmethode wie yolov4 – Mosaik. Unter Verwendung von vier Bildern im Datensatz werden sie durch zufällige Skalierung, Zuschnitt und Anordnung zusammengefügt. Zitat von Jiang Dabais Bild:
Die Vorteile der Verwendung von Mosaik zur Datenverbesserung:
- Durch die zufällige Skalierung werden viele kleine Ziele hinzugefügt, was nicht nur den Datensatz bereichert, sondern auch die Robustheit des Netzwerks verbessert.
- Mosaik kann vier Bilder direkt berechnen, wodurch die Größe des Mini-Batches reduziert wird und dadurch der Druck auf die Hardware des Netzwerktrainings verringert wird.
Adaptive Ankerbox
Die Rolle der anfänglichen Ankerbox: Das Netzwerk berechnet den Vorhersagerahmen basierend auf dem anfänglichen Ankerrahmen, vergleicht ihn dann mit dem kalibrierten Rahmen und aktualisiert iterativ die Netzwerkparameter.
- In yolov3 und 4 wird das Programm zur Berechnung der Ankerbox separat ausgeführt. In yolov5 gibt es jedoch zwei Möglichkeiten: Eine besteht darin, die vorgegebene Ankerbox zu verwenden, die in der Yaml-Datei angezeigt und geändert werden kann, und die andere darin, zu starten es im Code Adaptive Ankerbox-Berechnungsfunktion.
1.2 Rückgrat
Fokusstruktur
Zwei Teile, einer ist eine Scheibe,