R-CNN论文详解（学习笔记）

R-CNN:基于候选区域的目标检测

Region proposals

基本概念(看论文前需要掌握的)：

1.cnn(卷积神经网络):CNN从入门到精通（初学者）

2.Selective search:选择性搜素

3.warp:图形region变换

5.IOU:交并比IOU=(A∩B)/(A∪B)

6.NMS:非极大值抑制

7.DPM：采用判别训练的部件模型进行目标检测

基于候选区域的目标检测原理图

第一步：输入图像，采用Selective Search 从原始图片中提取2000个左右区域候选框

第二步：划分区域提案，进行归一化：将所有候选框变为固定大小的（227*227）区域

第三步：CNN网络提取特征

第四步：SVM结合NMS(非极大值抑制)识别分类区域边框，采用DPM精修边框的位置

Selective research for object recognition(选择性搜索)

1.适应不同尺度：通过改变窗口的大小来适应物体的不同尺度，算法采用图像分割（image segmentation）和层次算法(Hierarchical Algorithm)

2.通过使用颜色、纹理、大小等多种分割策略对于分割好的区域进行合并

Supervised pre-trainning(有监督训练（迁移学习）)

对象分类：被标注的训练数据很多

目标检测：用少量的标注数据训练高质量的模型

迁移学习：采用Imagenet的数据集，进行预训练，然后在PASCAL进行微调

CNN网络提取特征

模型（Alexnet,VGG）

训练SVM分类器

训练特定类别的SVM分类器

训练SVM的正负样本：采用IOU阈值样本，计算每一个region proposal与标准框的IOU,当大于阈值0.3时则为正样本，小于阈值0.3时为负样本。

输入：CNN提取的区域特征

输出：每个候选区域特征的概率输出

CNN生成每个region proposal 固定长度的特征向量

svm计算每个region特征向量的score,并进行排序

NMS:选取概率最大的区域，计算与其他区域的IOU;当IOU大于给定阈值后丢弃该区域，同样的过程依次遍历所有region