深度学习(七)

卷积神经网络

目标定位

1、问题描述:既要判断出目标,又要对目标进行定位,因此需要判断有木目标,准确判断出是何种目标以及定位所画方框的位置
2、基于窗口滑动的目标检测算法:
1)使用固定步幅滑动窗口,检测窗口内有无目标,之后使用更大的窗口继续遍历,这样,总会有窗口包含目标,这种方法虽然可行,但计算代价太大
2)改进一:并不是将每个滑动窗口分别输入网络,而是将整张图片直接输入,这样可以实现参数共享,减少运算量,但存在一个问题,就是输出边界不精准
3)改进二:将图片分为许多部分,如3*3,标定目标的中点,只有中点所在的格子才被认为存在目标,之后标定边框。
3、评价指标:
交并比(IoU):预测边框与实际边框交集与并集之比,一般来说,只要交并比大于0.5就认为定位较为准确
4、非最大值抑制:
解决多次检测的问题,即只输出概率最大的结果,其他的边框进行抑制
5、多目标检测(anchor box)
使用不同形状的anchor box,如果发现同一个格子存在两个目标,则对anchor box进行研究,如图所示:
这里写图片描述
6、候选区域(RNP):
并非使用滑动窗,而是在图片中尝试选出一些有意义的窗口来运行算法

猜你喜欢

转载自blog.csdn.net/yeyustudy/article/details/81436513