一、目标定位

1、目标定位是要求图像中只有一个目标,则构建这个目标的位置信息,如一个网络输出8个值,一个是是否有目标的pc,4个目标位置信息的bx,by,bh,bw,其中bx,by为目标中心点坐标,bh,bw为目标的高和宽,最后3项为目标的类别。如下

对于有目标的pc为1,后面的值有意义,如果没有目标,则pc值为0,后面的值没有意义,对于loss function,如果有目标,则可以简单用8项的平方差,当然也可以用一些更好的方法,如pc用logistic regression损失函数,4个目标位置信息用类似平方差的方法,3个类别信息可以用softmax crossentropy。如果pc=0,直接对pc用平方差或logistic regression,如下:

猜你喜欢

转载自blog.csdn.net/fireflychh/article/details/81334952
今日推荐