YOLOV3
为什么叫 53 :因为有53个卷积,最后一个全连接层也算!
这里是convolutional其实是conv+BN+leakyRElu
这里的黑色框是个残差结构类似于这样:
yolov3 由聚类算法生成了9 个 bounding box ,最后分别生成三个特征图,每个特征图份三个
(下面这个图还是不错的 )
这里的虚线就是bounding box
关于正负样本的理解;首先对于每个Ground truth box都被分配一个bounding box 。和GT box重合度最大的bounding box 是正样本。设置一个阈值 假如大于0.5 ,但又不是最大,那么我们把它舍弃,小于0.5的都是负样本。对于 丢弃的 bounding box只有 confidence 这个损失。
原文提到了逻辑回归,用到了二值交叉熵损失。
蓝色框代表bounding box(锚框,聚类生成)
绿色 是grond truth box
黄色 是预测框
每种特征图,中每一个 grid 都有3个 bounding box