02-分类与目标检测识别

1、单个目标的识别/检测,当图像数据源较少的时候,而目标的分类任务还比较简单的时候,使用“迁移学习”,

     迁移学习的本质:使用少量数据对已经训练好的模型进行funetuning 微调,使得更容易、模型效果更好的目的。

最有影响力的目标检测的文章:

     (1)Rcnn    Region of  Interest , ROI,     可以检测到一张图像中有多个目标的应用场景。

            采用了一种目标候选项的方法,Region Proposal, 检测到目标物体的位置,使用Selective Search提取目标候选项RP,

            产生Region Proposal候选项之后再放入CNN去卷积特征提取;

将选择的候选区进行归一化处理, 让尺寸保持一致, 再将归一化之后的图像输入CNN进行卷积处理。

 

Faster-Rcnn 目标检测,

预测网络的结构,

即:前向神经网络,通过前向神经网络能够加载模型的参数,并且得到预测的结果:

红色框的是产生一个初略的位置,  黄色框产生的是一种精确的框;

3、性能、耗时的比较

     

项目案例:人脸识别、人脸关键点的检测

语义分割

卷尺的结构D3xH/4xW/4的左右两侧的卷积结构是一种对称的

卷积层的上采样Upsampling,也叫反卷积Dconvolution,或称,  转置卷积Transpose Convolution

特征图大小计算公式  =  [  (输入特征图尺寸   - 卷积核尺寸)/步长  ]  + 1     =    ( 4 - 3 )/1 + 1  = 2

正向卷积

反卷积流程

不同的步长,卷积上采样的另外一个例子:

使用技巧:

        FCN(全卷积神经网络) 可以做图像的边缘提取,

     使用全卷积网络实现——“视频场景人数估计”

        http://www.docin.com/p-980377427.html

拥挤的场景下,需要先进行人头的标注,然后再进行模型训练,与高斯核卷积生成一种热度图HeapMap;实验测试效果如下:

实时(视频的热度图)运动人群的动态热度图,行人热度图:

猜你喜欢

转载自blog.csdn.net/cbd_2012/article/details/84073765
02-
今日推荐