深度学习算法三：语义分割(SegNet+ResNet50)思路理解小记录 - 代码天地

深度学习算法三：语义分割(SegNet+ResNet50)思路理解小记录

其他 2021-03-07 06:50:54 阅读次数: 0

语义分割一般都是使用的全卷积网络，也即可以先提取特征，这时候尺寸会变小，然后会再把尺寸变大到原尺寸，或者说是和训练图片相同的尺寸。因此我们一般需要编码器提取特征，然后再使用解码器恢复尺寸。这里的编码器就是ResNet50，解码器就是SegNet。语义分割其实就是对每一个像素进行分类。

一、编码器(ResNet50)

1、它有两个block，一个是identity_block，一个是conv_block。其中，identity_block内部经过了三次通道变换，由于这是一个残差块，所以经过三次通道变换之后要与输入数据的通道数相同，并且尺寸也要一样，所以在这个block内部通过我们设置参数并没有使尺寸改变

2、conv_block内部有四个conv2d，中间两个都不改变尺寸，只有第一个和第四个可以通过我们设置步幅来改变尺寸。其中第四个conv2d是直接对输入数据改变尺寸，而不是已经经过三个卷积层的输入数据，这是为了输入数据和已经经过三个conv2d的数据能够相加，也即通道数和尺寸都一样。

3、然后我们在get_resnet50_encoder函数里，多次调用这两个block，然后每压缩一次就赋值给f，所以最后返回了[f1 , f2 , f3 , f4 , f5 ]五个特征图。

二、解码器(SegNet)

1、它会对通过编码器提取到的特征进行上采样，在这个例子里，是上采样到原图的(h/2，w/2),这和训练数据集，也即已经进行语义分割好的图片的大小是要一样的，因为我们是对每一个像素进行分类。

2、最后解码器的输出是(h/2，w/2，2)，这里的2代表像素所属的两个类，要么是0：背景、要么是1：要分割的部分

注意：需要注意的是，训练图片，也就是已经进行过语义分割的图片，其实三个通道的数据是一样的，一个像素位置处的三个通道，要么是(0,0,0)，要么是（1,1,1），也即不是黑色就是白色。所以其实我们预测的时候可以只预测一个通道就可以了，也即最终的输出是(h/2，w/2，2)而不是(h/2，w/2，6)

参考工程附上：

https://blog.csdn.net/weixin_44791964/article/details/103244411

https://github.com/bubbliiiing/Semantic-Segmentation

猜你喜欢

转载自blog.csdn.net/qq_39507748/article/details/109984362

深度学习算法三：语义分割(SegNet+ResNet50)思路理解小记录

深度学习语义分割网络学习记录Unet、PSPNet、SegNet、DLinkNet

[深度学习]Semantic Segmentation语义分割之SegNet(3)

深度学习语义分割(二)SegNet论文解读

深度学习--语义分割（1）：SegNet论文详解

深度学习算法二：人脸检测与识别(mtcnn+facenet)思路理解小记录

深度学习算法一：目标检测(yolov3)思路理解小记录

【深度学习】语义分割-研究思路

深度学习应用篇-计算机视觉-语义分割综述[5]：FCN、SegNet、Deeplab等分割算法、常用二维三维半立体数据集汇总、前景展望等

语义分割SegNet

语义分割网络-Segnet

AI 语义分割 SegNet

语义分割——SegNet（四）

语义分割中的深度学习方法全解：从FCN、SegNet到各代DeepLab

语义分割中的深度学习方法全解：从FCN、SegNet到各版本DeepLab

【深度学习】语义分割网络介绍对比-FCN，SegNet，U-net DeconvNet

深度学习-＞语义分割实战（一）：SegNet详解与Tensorflow2.0实现

图像语义分割的深度学习算法综述

caffe 深度学习语义分割语义理解

语义分割之SegNet，Bayesian SegNet

深度学习语义分割

基于深度学习的三维语义理解（分割）综述列表

【深度学习】 ResNet的理解

基于深度学习的图像语义分割算法综述（转载）

基于深度学习的图像语义分割算法综述（截止20180715）

深度学习-语义分割总结

基于深度学习的语义分割

Caffe学习记录(十) SegNet等分割网络学习

可解释深度学习：从感受野到深度学习的三大基本任务：图像分类，语义分割，目标检测，让你真正理解深度学习

图像语义分割(4)-SegNet:深度全卷积编解码结构

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)