深度学习-全卷积神经网络（FCN） - 代码天地

深度学习-全卷积神经网络（FCN）

企业开发 2023-08-12 21:33:43 阅读次数: 0

1. 简介
全卷积神经网络（Fully Convolutional Networks，FCN）是Jonathan Long等人于2015年在Fully Convolutional Networks for Semantic Segmentation一文中提出的用于图像语义分割的一种框架，是深度学习用于语义分割领域的开山之作。我们知道，对于一个各层参数结构都设计好的神经网络来说，输入的图片大小是要求固定的，比如AlexNet，VGGNet, GoogleNet等网络，都要求输入固定大小的图片才能正常工作。 $\color{blue}{而FCN的精髓就是让一个已经设计好的网络可以输入任意大小的图片}$ 。
2. FC网络结构
FCN网络结构主要分为两个部分：全卷积部分和反卷积部分。其中全卷积部分为一些经典的CNN网络（如VGG，ResNet等），用于提取特征；反卷积部分则是通过上采样得到原尺寸的语义分割图像。FCN的输入可以为任意尺寸的彩色图像，输出与输入尺寸相同，通道数为n（目标类别数）+1（背景）。
3. CNN和FCN网络结构对比
CNN网络
假如我们要设计一个用来区分猫，狗和背景的网络，CNN的网络的架构应该是如下图：
在这里插入图片描述
假如输入图片size为14x14x3的彩色图，如上图，首先经过一个5x5的卷积层，卷积层的输出通道数为16，得到一个10x10x16的一组特征图，然后经过2x2的池化层，得到5x5x16的特征图，接着Flatten后进入两个50个神经元的全连接层，最后输出分类结果。
$\color{blue}{其中Flatten要求卷积输出的特征图的大小是固定的，因为它要把特征图的所有像素点连接起来，这就导致反推出卷积层的输入大小要求是固定的。}$
比如：在含有全连接层的神经网络中，假设输入的图像大小一样，那经过卷积得到特征的尺寸也都是相同的。如输入特征尺寸为 a × b，之后连接一个1 × c 的全连接层，那么卷积层的输出与全连接层间的权值矩阵大小为( a × b ) × c。但如果输入与原图像大小不同，得到新的卷积输出为 a ′ × b ′
。与之对应，卷积层的输出与全连接层间的权值矩阵大小应为 ( a ′ × b ′ ) × c 。很明显，权值矩阵大小发生了变化，故而也就无法使用和训练了。

FCN网络
全卷积神经网络，顾名思义是该网络中全是卷积层链接，如下图：
在这里插入图片描述
该网络在前面两步跟CNN的结构是一样的，但是在CNN网络Flatten的时候，FCN网络将之换成了一个卷积核size为5x5，输出通道为50的卷积层，之后的全连接层都换成了1x1的卷积层。1x1的卷积其实就相当于全连接操作。
从上两个图比较可知全卷积网络和CNN网络的 $\color{blue}{主要区别在于FCN将CNN中的全连接层换成了卷积操作。}$
换成全卷积操作后，由于没有了全连接层的输入层神经元个数的限制，所以卷积层的输入可以接受不同尺寸的图像，也就不用要求训练图像和测试图像size一致。
那么问题也来了，如果输入尺寸不一样，那么输出的尺寸也肯定是不同的，那么该如何去理解FCN的输出呢？
4. 理解FCN网络的输出
特征图尺寸变化
我们首先不考虑通道数，来看一下上面网络中的特征图尺寸的具体变化，如下图，图中绿色为卷积核，蓝色为特征图：
在这里插入图片描述
从上图中，我们可以看到，输入是一个14x14大小的图片，经过一个5x5的卷积（不填充）后，得到一个10x10的特征图，然后再经过一个2x2的池化后，尺寸缩小到一半变成5x5的特征图，再经过一个5x5的卷积后，特征图变为1x1，接着后面再进行两次1x1的卷积（类似全连接操作），最终得到一个1x1的输出结果，那么该1x1的输出结果，就代表最前面14x14图像区域的分类情况，如果对应到上面的猫狗和背景的分类任务，那么最后输出的结果应该是一个1x3的矩阵，其中每个值代表14x14的输入图片中对应类别的分类得分。
不同尺寸的输入图片
好了，不是说可以接收任意尺寸的输入吗？我们接下来看一个大一点的图片输入进来，会得到什么样的结果，如下图：
在这里插入图片描述
我们可以看到上面的图，输入尺寸由原来的14x14变成了16x16，那么经过一个5x5的卷积（不填充）后，得到一个12x12的特征图，然后再经过一个2x2的池化后，尺寸缩小到一半变成6x6的特征图，再经过一个5x5的卷积后，特征图变为2x2，接着后面再进行两次1x1的卷积（类似全连接操作），最终得到一个2x2的输出结果，那么该2x2的输出结果，就代表最前面16x16图像区域的分1类情况，然而，输出是2x2，怎么跟前面对应呢？
哪一个像素对应哪个区域呢？
我们看下图：
在这里插入图片描述
根据卷积池化反推，前面图3，我们知道，最后的输出1x1代表了前面14x14的输入的分类结果，那么我们根据卷积核的作用范围可以推出，上图中最后输出2x2中左上角的橙色输出就代表了16x16中的橙色区域（红色框），依次类推，输出2x2中右上角的蓝色输出就代表了16x16中的黄色框区域，输出2x2中左下角的蓝色输出就代表了16x16中的黑色框区域，输出2x2中右下角的蓝色输出就代表了16x16中的紫色框区域，其中每个框的大小都是14x14.也就是说输出的每个值代表了输入图像中的一个区域的分类情况。

参考
FCN（全卷积神经网络）详解
 全卷积神经网络FCN

猜你喜欢

转载自blog.csdn.net/weixin_40826634/article/details/128197818

深度学习-全卷积神经网络（FCN）

深度学习笔记（基础）——（六）全卷积神经网络（FCN）

机器学习21:全卷积神经网络FCN

全卷积神经网络FCN

AI 全卷积神经网络 FCN

FCN全卷积神经网络

全卷积网络FCN与卷积神经网络CNN的区别

全连接卷积神经网络 FCN fully convolutional network 动手学深度学习v2

（转载）深度学习-FCN全卷积网络

深度学习：全卷积网络（FCN）

全卷积神经神经网络-深度学习笔记

基于区域的全卷积神经网络（R-FCN）

R-FCN 基于区域的全卷积神经网络

基于全卷积神经网络(FCN)实现图像分割

[ 深度学习 ] —— 基础知识： FCN全卷积网络

[深度学习] FCN 全卷积网络语义分割

动手学深度学习_全卷积网络 FCN

深度学习论文精读[1]：FCN全卷积网络

机器学习——深度神经网络实践（FCN、CNN、BP）

【深度学习】卷积神经网络入门

深度学习【一】卷积神经网络

深度学习与卷积神经网络

【深度学习】卷积神经网络原理

深度学习之卷积神经网络

深度学习——卷积神经网络认知

深度学习资源---卷积神经网络

【深度学习】：卷积神经网络(CNN)

深度学习（1）卷积神经网络

深度学习笔记——卷积神经网络

深度学习--卷积神经网络

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)