série yolov3 (zéro) -yolov3 détaillée

Page d'accueil de yoloV3:

https://pjreddie.com/darknet/yolo/

Site de référence

https://blog.csdn.net/leviopku/article/details/82660381
https://blog.csdn.net/u012746060/article/details/81183006
https://blog.csdn.net/Patrick_Lxc/article/details/80615433
https://www.cnblogs.com/gezhuangzhuang/p/10596545.html
https://blog.csdn.net/m0_37857151/article/details/81330699

L'algorithme de détection de cible de la série yolo peut être considéré comme un chef-d'œuvre dans l'histoire de la détection de cible. L'algorithme v3 est formé sur la base de v1 et v2 . Premier regard sur yolov1 et yolov2

0. Introduction générale

Insérez la description de l'image ici

1. Structure du réseau

La figure ci-dessous montre la structure du réseau
yolov3
DBL (Darknetconv2d_BN_Leaky) de yolov3: c'est le composant de base de yolov3. C'est 卷积 + BN + Leaky relu
Res_unit : DBL + DBL ADD
Resn : n représente les nombres res1, res2 ... res8, etc., indiquant combien de res_units sont contenus dans ce res_block. Reportez-vous à resnet
concat : coutures tenseur. Rejoignez la couche intermédiaire darknet et une certaine couche derrière.拼接的操作和残差层 add 是不一样，拼接会扩张张量的维度，而 add 只是直接相加，不会导致张量维度的改变

yolov3

darknet-53

darknet-53
yolov3使用了 darknet53 前面的52层，yolov3这个网络是一个全卷积网络大量使用残差的跳层连接，并且为了降低池化带来的梯度负面效果，作者直接屏弃了 Pooling ,用 conv 的 stride 来实现降采样。在这个网络结构中使用的是步长为2的卷积来降采样为了加强算法对小目标检测的精确度，yolov3中采用类似 FPN 的 upsample 和融合做法（最后融合了3个scale其他两个scale的大小分别是 26*26、52*52），在多个 scale 的 feature map 上做检测作者在3条预测支路采用的也是全卷积的结构，其中最后一个卷积层的卷积核个数是255，是针对COCO数据集的80类：3*(80+4+1)=255，3表示一个grid cell包含3个bunding box，4表示框的4个坐标信息，1表示objectness score.

production

sortie yolov3
`` Le soi-disant multi-taille vient de ces trois chemins de prédiction. La profondeur de y1, y2 et y3 sont toutes de 255 et la règle de la longueur des côtés est 13:26:52. Ce que yolov3 définit, c'est que chaque unité réseau prédit 3 boîtes, donc chaque boîte doit avoir cinq paramètres de base (x, y, w, h, confiance), puis il y a 80 catégories de probabilités. Donc 3 * (80 + 4 + 1) = 255

Comment sont venues les v1, v2, v3

-À suivre

référence