Shape-IoU: Eine Metrik, die die Form und Skalierung des Begrenzungsrahmens berücksichtigt

Zusammenfassung

https://arxiv.org/pdf/2312.17663.pdf
Als wichtiger Teil des Detektorlokalisierungszweigs spielt der Regressionsverlust des Begrenzungsrahmens eine wichtige Rolle bei Objekterkennungsaufgaben. Bestehende Bounding-Box-Regressionsmethoden berücksichtigen normalerweise die geometrische Beziehung zwischen der Ground-Truth-Box (GT-Box) und der vorhergesagten Box und verwenden die relative Position und Form der Bounding-Box, um den Verlust zu berechnen, während sie die inhärenten Eigenschaften der Bounding-Box ignorieren ( wie Form und Skalierung). ) bei der Bounding-Box-Regression. Um die Mängel der bestehenden Forschung auszugleichen, schlägt dieser Artikel eine Bounding-Box-Regressionsmethode vor, die sich auf die Form und den Maßstab des Bounding-Boxes selbst konzentriert. Zuerst haben wir die Regressionseigenschaften des Begrenzungsrahmens analysiert und festgestellt, dass die Form und die Skalierungsfaktoren des Begrenzungsrahmens selbst die Regressionsergebnisse beeinflussen. Basierend auf den obigen Schlussfolgerungen schlagen wir die Shape-IoU-Methode vor, die den Verlust berechnen kann, indem sie sich auf die Form und den Maßstab des Begrenzungsrahmens selbst konzentriert, wodurch die Begrenzungsrahmen-Regression genauer wird. Schließlich haben wir unsere Methode durch eine große Anzahl von Vergleichsexperimenten verifiziert. Die experimentellen Ergebnisse zeigen, dass unsere Methode die Erkennungsleistung effektiv verbessern und bestehende Methoden übertreffen kann, sodass sie bei verschiedenen Erkennungsaufgaben eine Leistung auf dem neuesten Stand der Technik erreicht. Der Code ist unter https://github.com/malagoutou/Shape-IoU verfügbar.

Indexbegriffe: Objekterkennung, Verlustfunktion und Bounding-Box-Regression

Guess you like

Origin blog.csdn.net/hhhhhhhhhhwwwwwwwwww/article/details/135436999