Brève introduction de Faster R-CNN

Faster R-CNN
est une architecture de réseau neuronal profond pour la détection d'objets. Il s'agit d'un réseau d'apprentissage multitâche qui apprend simultanément la détection d'objets et l'extraction de caractéristiques dans un seul réseau de neurones.
L'architecture réseau de Faster R-CNN se compose de trois parties :

1. Extracteur de caractéristiques
L'extracteur de caractéristiques est utilisé pour extraire des caractéristiques de l'image d'entrée, qui peut être un réseau neuronal convolutif pré-formé (tel que VGG, ResNet, etc.) ou un réseau neuronal personnalisé.

2. Réseau de proposition de région (RPN)
Le RPN est un réseau de génération de propositions qui intègre des cartes d'entités et génère des propositions rectangulaires d'objets à l'intérieur.

3. Classificateur.
Un classificateur utilise ces caractéristiques proposées pour prédire la classe de l'objet.

L'architecture réseau de Faster R-CNN se compose de deux parties principales : un réseau neuronal convolutif (Cnn) en tant qu'extracteur de caractéristiques et un réseau de proposition de région (Rpn) pour générer des régions d'objets candidats. Il utilise une couche convolutive partagée pour extraire les caractéristiques de l'image et une simple fenêtre coulissante pour rechercher des régions.

La formation au réseau de neurones est indispensable :
le processus de formation Faster R-CNN est le suivant : premièrement, utilisez l'extracteur de caractéristiques de l'image de formation pour générer une carte de caractéristiques.
Ensuite, RPN est utilisé pour générer des propositions d'objets à partir des cartes d'entités.
Ensuite, le classificateur prédit la classe de l'objet. Pour chaque prédiction, les performances du modèle sont évaluées à l'aide d'un algorithme d'apprentissage supervisé (tel que la perte d'entropie croisée), et les paramètres du modèle sont mis à jour via l'algorithme de rétropropagation. Une fois le modèle formé, il peut être utilisé dans des images de test pour la détection d'objets.

Test :
Le processus de test est similaire au processus de formation, sauf que la partie formation est supprimée. Un R-CNN plus rapide peut bien gérer les tâches de détection de cibles multi-cibles et multi-catégories, et a une grande efficacité lors du traitement d'images haute résolution.

おすすめ

転載: blog.csdn.net/weixin_47665864/article/details/129015186