实时语义分割网络BiSenet - 代码天地

实时语义分割网络BiSenet

企业开发 2023-07-12 00:21:47 阅读次数: 0

今天介绍的这篇论文是旷世的一篇实时语义分割网络，发表在ECCV2018。

论文链接：BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation

一、介绍

实时语义分割主要有以下三种加速模型的主要方式（如图a所示）：

1）通过resize或crop限制输入尺寸，来降低计算复杂度。

这种方式虽然简单有效，但是会造成spatial details（空间细节）的丢失，尤其会破坏边界附近的预测。

2）减少通道数量来提高前向速度。

这种方式弱化了spatial capacity（空间容量）。

3）放弃模型的最后stage，以追求一个非常紧凑的框架。如ENet。

这种方式对于大目标来说感受野不够大，会导致判别能力较差。

以上三种方式都是通过牺牲精度来提高速度，很难在工程上付诸实践。

为了弥补spatial details的丢失，很多人采用U型结构（如图b所示）。

这种结构的缺点在于：

1）U-shape结构在高分辨率特征图上引入额外的计算，会降低模型速度。

2）被pruning或cropping丢失掉的spatial information，无法通过引入浅层修复。

二、BiSenet：

整个结构分三部分：1、Spatial Path 2、Context Path 3、Feature Fusion Module

1、Spatial Path：这个分支很简单，就是卷积＋bn+relu，下采样8倍。

2、Context Path：先使用Xception快速下采样，尾部接一个全局pooling（下面哪个白色小方块），然后类似u型结构容和特征，只上采样两次，这里用到ARM，用于refine特征。之后上采样（双线性插值）到spatial path分路特征相同大小。

3、Feature Fusion Module：对细节特征和语义特征进行拼接，之后是一个类似senet的结构对信息进行整合。

损失：共有三部分损失，一部分是主loss，另外两部分相当于加了一个在context path的中间监督，三部分loss构成整个loss，比重1:1:1。

猜你喜欢

转载自blog.csdn.net/sinat_37574187/article/details/131612673

实时语义分割网络BiSenet

语义分割网络-BiSenet

图像语义分割(11)-BiSeNet:用于实时语义分割的双向分割网络

BiSeNet - 轻量级实时语义分割

BiSeNet：用于实时语义分割的双边分割网络——BiSeNet:Bilateral Segmentation Network for Real-time Semantic Segmentation

【论文阅读】BiSeNet V2用于实时语义分割的双边网络

BiSeNet 语义分割网络结构详细解析

BiSeNet 语义分割公众号幸运飞艇源码下载网络结构详细解析

教程--从零开始使用BiSeNet（语义分割）网络训练自己的数据集

实时语义分割DFANet

实时语义分割

(CVPR2019)图像语义分割(17)-DFANet:用于实时语义分割的深层特征聚合网络

【NIPS2018】实时联合目标检测与语义分割网络

实时语义分割网络STDC原理与代码解析（CVPR 2021）

实时语义分割之ICNet

语义分割网络-Segnet

语义分割网络——FCN

语义分割网络学习

YOLOv5+BiSeNet——同时进行目标检测和语义分割

MSFNet:多重空间融合网络进行实时语义分割（北航和旷视联合提出）

基于高效变压器和CNN的轻量级实时语义分割网络

Tensorflow实时语义分割开源工程

轻量级实时语义分割：ENet & ERFNet

实时语义分割PIDNet算法TensorRT转换

语义分割网络之PSPnet

点云语义分割网络

语义分割相关网络简述

RGPNET: A real-time general purpose semantic segmentation（复杂环境下实时通用语义分割网络）

HyperSeg: 基于块的超网络实时语义分割——HyperSeg:Patch-wise Hypernetwork for Real-time Semantic Segmentation

ICnet实时场景分割网络

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)