End-to-End United Video Dehazing andDetecting - 代码天地

End-to-End United Video Dehazing andDetecting

编程语言 2020-03-02 14:05:31 阅读次数: 0

1. 概述

考虑到在自动驾驶汽车中的应用，作者将去雾与目标检测结合，建立了一个端到端的网络。

雾图的生成通常是基于大气散射模型：
$I(x)=J(x)t(x)+A(1-t(x))， \tag{1}$ 其中 $I(x)$ 表示雾图， $J(x)$ 表示真实图片， $A$ 和 $t(x)$ 是两个关键的参数，分别表示大气光和透射图， $t(x)=e^{-\beta d(x)}$ ， $\beta$ 为大气散射系数， $d(x)$ 为物体到相机的距离。因此，真实图片又可以表示为 $J(x)=\frac{1}{t(x)}I(x)-A\frac{1}{t(x)}+A。 \tag{2}$
作者借鉴了AOD网络将其应用到视频去雾，再结合Faster-RCNN将其应用到视频目标检测，搭成最终模型如下图所示。

在这里插入图片描述

2. AOD

AOD网络结构如下图所示：

在这里插入图片描述

AOD将式（1）重写： $J(x)=K(x)I(x)-K(x)， \tag{3}$ 其中 $K(x)=\frac{\frac{1}{t(x)}(I(x)-A)+A}{I(x)-1}， \tag{4}$ 将 $\frac{1}{t(x)}$ 和 $A$ 合并到新变量 $K(x)$ 中。

2.1 Pipline

对输入 $I(x)$ 提取特征输出 $K(x)$ ，
应用公式(3)输出清晰图像。

3 AOD应用到视频去雾

由于AOD是用于单张图像去雾，因此作者将其进行了改进以处理视频去雾问题,其主要问题在于连续帧的混合(temporal fusion)。由于连续帧具有内在的联系，因此利用多帧相干性进行视频去雾有巨大前景。

3.1 混合连续帧的三种策略

作者同时将5(后面解释为什么是5)张图片输入给网络，在三个不同的阶段将其进行融合，分析比较他们的结果

I-Level Fusion： 在输入阶段将五个分支进行cancatenate。
K-Level Fusion： 在K估计阶段将五个分支图片的特征图进行concatenate。
J-Level Fusion： 在输出阶段将五个分支进行特征融合。

作者将AOD的参数作为初始化值，方便了模型的训练。

3.2 超参数的选择

通过最后的对比试验，作者在3，5，7中选择5作为输入连续帧的数量（3太少，7张连续帧内在联系没有那么大造成反噬）；选择K-Level Fusion 作为特征融合策略。

4 损失函数

作者选择MSE作为损失函数

5 目标检测

略

larkii

发布了102 篇原创文章 · 获赞 7 · 访问量 3732

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_44795555/article/details/104609670

End-to-End United Video Dehazing andDetecting

《End-to-End Learning of Motion Representation for Video Understanding》论文阅读

《End-to-End Learning of Motion Representation for Video Understanding》文献阅读

《A Generative Appearance Model for End-to-end Video Object Segmentation》

DVC: An End-to-end Deep Video Compression Framework(CVPR 2019) - Video Compression Paper Reading

Scale-space flow for end-to-end optimized video compression(CVPR 2020) - Video Compression Paper Reading

《End-to-end Video-level Representation Learning for Action Recognition》论文解读之DTPP

FEELVOS: Fast End-to-End Embedding Learning for Video Object Segmentation论文理解

论文阅读 | Multimodal Transformer Networks for End-to-End Video-Grounded Dialogue Systems

论文笔记——FEELVOS：Fast End-to-End Embedding Learning for Video Object Segmentation

【视频异常检测-论文阅读】Synthetic Temporal Anomaly Guided End-to-End Video Anomaly Detection

【论文笔记】FEELVOS: Fast End-to-End Embedding Learning for Video Object Segmentation

【踩坑】复现End-to-End Referring Video Object Segmentation with Multimodal Transformers

论文笔记：Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval

【论文笔记】视频实例分割 CVPR2021 Oral——VisTR：End-to-End Video Instance Segmentation with Transformers

Towards End-to-end

End-to-end Learning

转：CVPR2018 End-to-End Learning of Motion Representation for Video Understanding——TVNet：可端到端学习视频的运动表征

端到端无人驾驶文献学习：End-to-end Learning of Driving Models from Large-scale Video Datasets

A Small End-to-End Project

CXF开发End-to-End RESTful WebService

关于END-TO-END论文阅读

End-To-End Memory Networks 论文阅读

Crnn中文end-to-end识别

An end-to-end TextSpotter with Explicit Alignment and Attention

End-to-end Optimized Image Compression

End-To-End Memory Network 学习整理

端到端（end-to-end）学习

Tacotron: Towards End-to-End Speech Synthesis

什么是end-to-end神经网络？

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)