R-CNN:基于候选区域的目标检测
Region proposals
基本概念(看论文前需要掌握的):
1.cnn(卷积神经网络):CNN从入门到精通(初学者)
2.Selective search:选择性搜素
3.warp:图形region变换
4.Supervised pre-trainning:有监督预训练-迁移学习
5.IOU:交并比IOU=(A∩B)/(A∪B)
6.NMS:非极大值抑制
7.DPM:采用判别训练的部件模型进行目标检测
基于候选区域的目标检测原理图
第一步:输入图像,采用Selective Search 从原始图片中提取2000个左右区域候选框
第二步:划分区域提案,进行归一化:将所有候选框变为固定大小的(227*227)区域
第三步:CNN网络提取特征
第四步:SVM结合NMS(非极大值抑制)识别分类区域边框,采用DPM精修边框的位置
Selective research for object recognition(选择性搜索)
1.适应不同尺度:通过改变窗口的大小来适应物体的不同尺度,算法采用图像分割(image segmentation)和层次算法(Hierarchical Algorithm)
2.通过使用颜色、纹理、大小等多种分割策略对于分割好的区域进行合并
Supervised pre-trainning(有监督训练(迁移学习))
对象分类:被标注的训练数据很多
目标检测:用少量的标注数据训练高质量的模型
迁移学习:采用Imagenet的数据集,进行预训练,然后在PASCAL进行微调
CNN网络提取特征
模型(Alexnet,VGG)
训练SVM分类器
训练特定类别的SVM分类器
训练SVM的正负样本:采用IOU阈值样本,计算每一个region proposal与标准框的IOU,当大于阈值0.3时则为正样本,小于阈值0.3时为负样本。
输入:CNN提取的区域特征
输出:每个候选区域特征的概率输出
获取Bounding box
CNN生成每个region proposal 固定长度的特征向量
svm计算 每个region特征向量的score,并进行排序
NMS:选取概率最大的区域,计算与其他区域的IOU;当IOU大于给定阈值后丢弃该区域,同样的过程依次遍历所有region