基于深度学习的实例分割相关论文读后总结(重新整改后)

一、过去几年中:
1.1 深度卷积网络(CNN)(图像分类):最初被设计用于解决图像级分类问题,此类算法的任务是输出给定图片的类别。
现如今,计算机视觉领域中,输出结果还包括位置和形状,即需要对图像进行像素级的分类处理,输出目标的形状和位置。
规模较大的卷积神经网络需要图片样本数量庞大(10万以上)。
二、现如今:
2.1 目标检测技术(目标位置):检测出图片中目标的位置,并且确定其类别。(实力分割的基础性的算法)(基于深度学习技术)
(1)单阶段目标检测算法
(2)两阶段目标检测算法
深度学习技术
三、分类的深度卷积神经网络
RCNN系列模型——>Faster-RCNN模型(最成熟)将候选框提取+边框回归+目标分类整合到一个神经网络。
Mask分支(Faster-RCNN基础上):实例分割
分为两个阶段:(1)提出备选框的位置和大小。(2)对候选框进行判断和边框回归
优点:检测精度高、较强的拓展性
四、神经网络权重的可迁移性
4.1 模型第一层的参数—Gabor滤波器的参数---->相似(不同数据集、不同训练任务(监督图像分类、无监督密度学习、无监督学习稀疏表示))
4.2 深度神精网络(参数规模大、训练代价高):浅层网络—>通用特征;深层网络—>专用特征
4.3 (1)由于网路中的特征提取的通用性,我们可将其他数据集的训练结果迁移到我们的数据集。
(2)迁移学习(降低训练代价)的目标:利用一个基础数据集训练出参数并应用于一个专业领域的数据集中
(3)流程:在一个基础数据集上训练一个神经网络—>将学习到的特征参数保存并提取出我们需要的部分—>学习到的参数迁移到我们的模型中—>在目标数据集上对网络进行训练。
五、类别权重(模型层面)/有偏交叉熵损失函数(数据层面)—>区分大小

总体结构

一、
问题:大小不一和样本不均衡
解决方法:(1)将缩小或扩大不同维度图片作为输入来生成出反映不同维度信息的特征组合(对于计算平台的硬件性能和内存容量提出高要求—>只能在有限领域内部使用)
(2)利用常规CNN模型内部从上至下各个层对同一图片不同维度的特征进行抽取,并对抽取的特征图从上至下进行特征融合
特征金字塔网络(FPN)是一种高效的CNN多尺度特征提取方法。
二、
涉及方法:特征金字塔网络(多尺度特征提取)、深度残差网络ResNet101、类别权重修正(目标分类损失)、迁移学习(预训练参数)
三、框架三部分:
(1)图像特征提取---->深度残差网络(ResNet)+特征金字塔网络(FPN)==》提取不同分辨率的特征
(2)候选区域生成网络(RPN)—>对不同分辨率的目标采用独立权重的分类模块分离图片中的目标
(3)候选区域的目标分类+语义分割网络—>对象:分离出的目标

图像特征提取

一、 深度残差网络:
网络退化:单纯叠加更多层会导致网络性能降低
构建更深层次的网络:构建较浅模型–>添加很多恒等映射的网络层
1.1 残差单元
(1)对于一个卷积层堆积结构,输入为x,期望的输出为H(x),预期输出与输入的残差值F(x)=H(x)-x
原始学习特征是H(x);输出结果是F(x)
当F(x)=0,是恒等映射
(2)短路机制(将高层梯度直接传播到低层):最终输出为H(x)=F(x)+x

(3)残差单元表示为:y1=h(xi)+F(x1,W1);xi+1=Relu(y1)
xi、xi+1分别表示第i个残差单元的输入、输出;每个残差单元是多个堆积层构成的复合结构
1.2 两种残差结构
(1)起因:一个残差块至少包含两个卷积层,两层卷积后的输出与原始输入数据不一致–>分辨率不一致、层次不一致==》矩阵加法运算要求维数一致
(2)方法:1*1卷积运算
分辨率不一致:降采样操作
维度不一致:升维操作

1.3 残差网络结构
不同尺度;不同深度的n个层次
二、特征金字塔网络(FPN)
将高层特征的语义信息融合到低层次特征图
[c1,c2,c3,c4,c5]所输出的特征图通道数分别为[64,256,512,1024,2048],以分辨率为512512的原始图像为例,五个阶段的特征图分辨率分别为[256256,128128,6464,3232,1616]

鲁棒性

目标检测定位

一、区域生成网络
通过不同尺度的窗口滑动来遍历图像的不同大小的各个区域,并采用分类算法对区域进行二分类,区分待检测的目标和背景。
基于特征图的候选区域生成网络(RPN)
1.1 候选框预设
对目标大小(n种)、长宽比(m种)进行预设
1.2 候选区域采集
流程:(1)对特征图进行一次3*3卷积,扩大感受域
(2)对每层特征图的所有像素点进行一轮遍历,每个像素点生成n个候选区域
1.3 特征金字塔到候选区域的映射

1.4 候选区域筛选
1.5 前背景分离

猜你喜欢

转载自blog.csdn.net/hhyukJae/article/details/106890906