深度学习【49】Fast End-to-End Trainable Guided Filter - 代码天地

深度学习【49】Fast End-to-End Trainable Guided Filter

编程语言 2018-04-23 21:50:33 阅读次数: 5

代码：https://github.com/wuhuikai/DeepGuidedFilter
该论文将何凯明的引导滤波思想引入了深度学习。我们都知道引导滤波的引导矩阵，根据不同的任务需要手工选定。在这篇文章里，作者将引导图片作为神经网络的学习的一部分，根据不同的任务会自动学习出该引导矩阵。
在利用神经网络生成图片中，特别是高分辨率图片，一般其速度非常慢，比如pix2pix。该论文在引入引导滤波后只需要先生产低分辨率图片，然后将引导矩阵上采样，接着利用引导滤波公式就能够生产高分辨率的图片。这样一来主要计算都集中在低分辨率的图片上，高分辨图片生成的计算量就变得很少。其实在pix2pixHD中也有类似的设计，只不过不是用引导滤波。下图是论文的主要思想：
这里写图片描述

其中 $C_l$ 是生成低分辨率图片的卷积神经网络，GF是引导滤波层，其输入是两张低分辨图片分别是 $C_l$ 的输入和输出图片，以及高分辨率待转换图片。

高分辨率输出图片 $O_h$ 可以用一下公式求得：
这里写图片描述
其中 $A_h,b_h$ ，就是引导滤波的关键参数

OK，其实我们最关心的还是引导滤波层的设计或者说 $A_h,b_h$ 是怎么求的，直接上图：
这里写图片描述

图中蓝色箭头代表正向传播，橙色箭头代表反向传播，我们只关注正向传播。
F(I)也是由卷积层构成，不过比较小，就两层而已。 $f_u$ 是均值滤波，r是其半径， $f_{\dagger}$ ，是双向性上采样。 $\epsilon$ 是正则项，一个常数，取 $1e^{-8}$ 。这个图要配合着下面这个算法流程看，才比较好懂：
这里写图片描述
其中 $*,/$ 都是element-wise操作。
将算法中的第3，4步，与引导滤波中求解a和b公式对比一下，发现几乎完全一样。

其中 $O_l,\bar{O_l}$ 对应 $p,\bar{p}$ ， $\bar{G_l},\sum_{G_l}$ ，对应 $u,\sigma^2$ 。

实验结果

速度和占用内存比较：
这里写图片描述
虚线代表CPU，实线代表GPU。DGF代表论文的模型。可以发现论文的算法速度非常快，特别是在高分辨率情况下。

效果：
这里写图片描述

猜你喜欢

转载自blog.csdn.net/linmingan/article/details/80057075

深度学习【49】Fast End-to-End Trainable Guided Filter

论文学习：《A network-based end-to-end trainable task-oriented dialogue system》

深度学习论文翻译解析（二）：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition

fast guided filter原理详解

End-To-End Memory Network 学习整理

端到端（end-to-end）学习

白翔2018Mask TextSpotter: An End-to-End Trainable Neural Network for Spotting Text with Arbitrary Shap

A Network-based End-to-End Trainable Task-oriented Dialogue System

论文翻译：Higher Order Potentials in End-To-End Trainable Conditional Ran-dom Fields

An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition

Mask TextSpotter: An End-to-End Trainable Neural Network for Spotting Text with Arbitrary Shapes

CFNet：End-to-end representation learning for Correlation Filter based tracking

【视频异常检测-论文阅读】Synthetic Temporal Anomaly Guided End-to-End Video Anomaly Detection

深度学习的 “ 端到端模型（end-to-end learning）”

深度学习的“ 端到端模型“（end-to-end learning）

fast guided filter代码实现与测试

《An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its...》论文阅读之CRNN

端到端的学习end-to-end learning （理解）

端到端的学习（end-to-end learning）

【小白笔记】CFNet：End-to-end representation learning for Correlation Filter based tracking

End-to-end 深度学习里面端到端学习的兴起

深度学习基础--端到端学习（end-to-end learning）

FEELVOS: Fast End-to-End Embedding Learning for Video Object Segmentation论文理解

论文笔记——FEELVOS：Fast End-to-End Embedding Learning for Video Object Segmentation

【论文笔记】FEELVOS: Fast End-to-End Embedding Learning for Video Object Segmentation

引导滤波Guided Filter

深度之眼Paper带读笔记NLP.20：End-to-End Memory Networks

对机器学习中end-to-end learning（端到端学习）的理解

机器学习中什么是端到端的学习（end-to-end learning）？

机器学习三人行(系列三)---End-to-End机器学习建模

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)