R-CNN论文详解(学习笔记)

R-CNN:基于候选区域的目标检测


Region proposals

基本概念(看论文前需要掌握的):

1.cnn(卷积神经网络):CNN从入门到精通(初学者)

2.Selective search:选择性搜素

3.warp:图形region变换

4.Supervised pre-trainning:有监督预训练-迁移学习

5.IOU:交并比IOU=(A∩B)/(A∪B)

6.NMS:非极大值抑制

7.DPM:采用判别训练的部件模型进行目标检测

基于候选区域的目标检测原理图

第一步:输入图像,采用Selective Search 从原始图片中提取2000个左右区域候选框

第二步:划分区域提案,进行归一化:将所有候选框变为固定大小的(227*227)区域

第三步:CNN网络提取特征

第四步:SVM结合NMS(非极大值抑制)识别分类区域边框,采用DPM精修边框的位置

Selective research for object recognition(选择性搜索)

1.适应不同尺度:通过改变窗口的大小来适应物体的不同尺度,算法采用图像分割(image segmentation)和层次算法(Hierarchical Algorithm)

2.通过使用颜色、纹理、大小等多种分割策略对于分割好的区域进行合并

 Supervised pre-trainning(有监督训练(迁移学习))

对象分类:被标注的训练数据很多

目标检测:用少量的标注数据训练高质量的模型

迁移学习:采用Imagenet的数据集,进行预训练,然后在PASCAL进行微调

CNN网络提取特征

模型(Alexnet,VGG)

训练SVM分类器

训练特定类别的SVM分类器

训练SVM的正负样本:采用IOU阈值样本,计算每一个region proposal与标准框的IOU,当大于阈值0.3时则为正样本,小于阈值0.3时为负样本。

输入:CNN提取的区域特征

输出:每个候选区域特征的概率输出

获取Bounding box

CNN生成每个region proposal 固定长度的特征向量

svm计算 每个region特征向量的score,并进行排序

NMS:选取概率最大的区域,计算与其他区域的IOU;当IOU大于给定阈值后丢弃该区域,同样的过程依次遍历所有region


猜你喜欢

转载自blog.csdn.net/ghw15221836342/article/details/79687716