MachMap: Durchgängige vektorisierte Lösung für die Erstellung kompakter HD-Karten

Referenz:Keine

Motivation und Ausgangspunkt
Horizons MapTR hat die Fähigkeit bewiesen, hochpräzise Karten zu erstellen, aber sein Mechanismus ist tatsächlich etwas kompliziert. Um mit der Ausrichtung verschiedener Fahrspurlinien, den Start- und Endpunkten kreisförmiger Fahrspurlinien usw. kompatibel zu sein, wurde die Übereinstimmungslogik von Permit-Equal speziell entwickelt. Diese Art von Logik ist wirklich zu mühsam. Bei der Beschreibung von Fahrspurlinien wird eine feste Anzahl von Punkten verwendet, was es schwierig macht, die Details einiger Fahrspurlinien zu erfassen. Das heißt, bei der ursprünglichen einheitlichen Stichprobe wird der entsprechende Bereich nicht abgetastet, was zu Ungenauigkeiten führt. In diesem Zusammenhang schlägt dieser Artikel einen abfragebasierten Algorithmus zur Erkennung von Fahrspurlinien vor, der Hypothesenprioritäten und Schlüsselpunktregression verwendet, um die oben genannten Probleme zu lösen. Bei diesem Artikel handelt es sich nicht um eine seriöse Arbeit, sondern lediglich um eine Zusammenfassung nach der Teilnahme am Wettbewerb. Und das in der Praxis auftretende Problem der Überanpassung wird überhaupt nicht erwähnt. Es kann als Referenz für Ideen verwendet werden.

Die Struktur des Algorithmus
Fügen Sie hier eine Bildbeschreibung ein
Aus dem Bild oben kann der im Artikel vorgeschlagene Algorithmus grob unterteilt werden in: BEV-Merkmalsextraktion, Timing-Fusion und Instanzdekodierung. Der BEV-Merkmalsextraktionsteil wird in Form von deformable-attn erhalten, was mehr auf der Genauigkeit interner und externer Parameter beruht. Der Timing-Fusion-Teil verwendet die Warp-Operation nach der Inter-Frame-Ausrichtung und verknüpft sie dann mit dem aktuellen Frame. Der Dekodierungsteil verwendet den Kopf der Instanzsegmentierung und ist auch mit der semantischen Segmentierung (Verbesserung der Vorder- und Hintergrundunterscheidung) und der Schlüsselpunktregression verbunden.

Wie entferne ich den komplexen Matching-Mechanismus?
In MapTR wird viel Aufwand darauf verwendet, die entsprechende Beziehung zwischen pred und GT herzustellen, was eine zweistufige Ausrichtungsoperation darstellt. In diesem Artikel wird ein Mechanismus zur Spurreihenfolge vorgestellt: von vorne nach hinten, von links nach rechts. Für eine Kreuzungsszene wird also der wahre Wert, der der Fahrspurlinie entspricht, als Ergebnis des mittleren Bildes unten dargestellt, aber die Richtung der Fahrspurlinie darf nicht durch Hinzufügen einer separaten Vorhersage verarbeitet werden?
Fügen Sie hier eine Bildbeschreibung ein

Wie kann ich wichtige Punkte zurückgeben?
Für die Extraktion von Fahrspurlinien-Schlüsselpunkten werden tatsächlich Entfernung und Winkel zur Extraktion verwendet, insbesondere diese beiden Algorithmen: Douglas-Peucker-Algorithmus und Visvalingam-Algorithmus. Die Fahrspurlinien nach dem Extrahieren wichtiger Punkte werden auf der rechten Seite der Abbildung oben angezeigt.

Wie kann man also die wichtigsten Punkte zurückgeben? Als Referenz kann eine Idee verwendet werden: PivotNet.

Vorhersagegrenzen-Mehrdeutigkeitsproblem bei der Zeitreihenfusion
Der im Artikel festgelegte Erfassungsbereich beträgt 30 m ∗ 60 m 30 m*60 m 30m60m, aber der wahrnehmbare Bereich des Bildes ist definitiv größer als dieser. Da der Algorithmus des Artikels also das Timing einführt, Dies führt zu einer inkonsistenten Übereinstimmung der wahren Werte zu unterschiedlichen Zeiten. Um mit dieser Situation umzugehen, wird eine Multi-Frame-Vorschlagsfusionsstrategie eingeführt. Die Ähnlichkeit wird durch Berechnen des Fasenabstands zwischen Vorschlägen beschrieben, und ähnliche Vorschläge werden zusammen aggregiert und dann verloren
Fügen Sie hier eine Bildbeschreibung ein

Experimentelle Ergebnisse
Leistung auf Argoverse2
Fügen Sie hier eine Bildbeschreibung ein

Supongo que te gusta

Origin blog.csdn.net/m_buddy/article/details/134939165
Recomendado
Clasificación