1、单个目标的识别/检测,当图像数据源较少的时候,而目标的分类任务还比较简单的时候,使用“迁移学习”,
迁移学习的本质:使用少量数据对已经训练好的模型进行funetuning 微调,使得更容易、模型效果更好的目的。
最有影响力的目标检测的文章:
(1)Rcnn Region of Interest , ROI, 可以检测到一张图像中有多个目标的应用场景。
采用了一种目标候选项的方法,Region Proposal, 检测到目标物体的位置,使用Selective Search提取目标候选项RP,
产生Region Proposal候选项之后再放入CNN去卷积特征提取;
将选择的候选区进行归一化处理, 让尺寸保持一致, 再将归一化之后的图像输入CNN进行卷积处理。
Faster-Rcnn 目标检测,
预测网络的结构,
即:前向神经网络,通过前向神经网络能够加载模型的参数,并且得到预测的结果:
红色框的是产生一个初略的位置, 黄色框产生的是一种精确的框;
3、性能、耗时的比较
项目案例:人脸识别、人脸关键点的检测
语义分割
卷尺的结构D3xH/4xW/4的左右两侧的卷积结构是一种对称的
卷积层的上采样Upsampling,也叫反卷积Dconvolution,或称, 转置卷积Transpose Convolution
特征图大小计算公式 = [ (输入特征图尺寸 - 卷积核尺寸)/步长 ] + 1 = ( 4 - 3 )/1 + 1 = 2
正向卷积
反卷积流程
不同的步长,卷积上采样的另外一个例子:
使用技巧:
FCN(全卷积神经网络) 可以做图像的边缘提取,
使用全卷积网络实现——“视频场景人数估计”
http://www.docin.com/p-980377427.html
拥挤的场景下,需要先进行人头的标注,然后再进行模型训练,与高斯核卷积生成一种热度图HeapMap;实验测试效果如下: