NFormer : réidentification robuste de la personne avec le transformateur voisin

2022CVPR's NFormer paper , code

contenu de la recherche

  • 研究动机: La ré-identification de la personne avec un apprentissage de représentation robuste discriminatoire est essentielle, mais de nombreux chercheurs envisagent d'apprendre des représentations à partir d'une seule image, ignorant l'interaction entre les images. Cependant, ignorer ces interactions conduit souvent à des caractéristiques aberrantes en raison de la grande variabilité au sein des identités.
  • 解决方法: Les réseaux NFromer sont proposés pour modéliser explicitement les interactions entre toutes les images d'entrée, supprimant ainsi les caractéristiques aberrantes et conduisant à des représentations plus robustes dans l'ensemble. Étant donné que la modélisation des interactions entre un grand nombre d'images est une tâche difficile avec un grand nombre de facteurs de distraction, NFormer introduit deux nouveaux modules, Landmark Agent Attention et Reciprocal Neighbor Softmax.
    • Le Landmark Agent Attention (LAA) modélise efficacement le graphe de relation entre les images en utilisant la factorisation de rang inférieur d'un petit nombre de points de repère dans l'espace des caractéristiques.
    • Reciprocal Neighbor Softmax (RNS) accorde une attention clairsemée aux voisins pertinents au lieu de se concentrer uniquement sur tous les voisins, ce qui atténue l'interférence des représentations non pertinentes et réduit encore la charge de calcul.

Fond de recherche

  • L'un des principaux défis de Re-ID est que tout individu peut être déformé par des facteurs extrinsèques (tels que différents réglages de caméra, éclairage, perspective, occlusion) ou des facteurs intrinsèques (tels que changer de vêtements)

Guess you like

Origin blog.csdn.net/u013308709/article/details/131505151