深度学习论文: PE-YOLO: Pyramid Enhancement Network for Dark Object Detection及其PyTorch实现

深度学习论文: PE-YOLO: Pyramid Enhancement Network for Dark Object Detection及其PyTorch实现
PE-YOLO: Pyramid Enhancement Network for Dark Object Detection
PDF: https://arxiv.org/pdf/2307.10953v1.pdf
PyTorch代码: https://github.com/shanglianlm0525/CvPytorch
PyTorch代码: https://github.com/shanglianlm0525/PyTorch-Networks

1 概述

当前的目标检测模型在许多基准数据集上取得了良好的结果,但在暗条件下检测物体仍然是一个巨大的挑战。为了解决这个问题,我们提出了一个金字塔增强网络(PENet),并将其与YOLOv3结合起来构建一个名为PE-YOLO的暗物体检测框架。首先,PENet使用拉普拉斯金字塔将图像分解为四个不同分辨率的组件。具体来说,我们提出了一个细节处理模块(DPM)来增强图像的细节,它由上下文分支和边缘分支组成。此外,我们提出了一个低频增强滤波器(LEF)来捕捉低频语义并防止高频噪声。PE-YOLO采用端到端的联合训练方法,只使用正常的检测损失来简化训练过程。我们在低光物体检测数据集ExDark上进行实验,以证明我们方法的有效性。
在这里插入图片描述

2 PE-YOLO

在这里插入图片描述

2-1 PENet

图像的Laplacian pyramid定义为
在这里插入图片描述
其中 G ( x ) G(x) G(x)定义为:
在这里插入图片描述
PENet通过拉普拉斯金字塔将图像分解为不同分辨率的组件。
在这里插入图片描述
从图像可以看出,Laplacian金字塔从底部到顶部更加关注全局信息,而相反地,它更加关注局部细节。这些信息都是在图像降采样过程中丢失的,也是PENet需要增强的对象。

2-2 Detail Enhancement

细节处理模块(DPM)用于增强拉普拉斯金字塔中的组件,DPM分为上下文分支(Context branch)边缘分支(Edge branch)上下文分支(Context branch) 通过捕捉远程依赖关系来获取上下文信息,并对组件进行全局增强。边缘分支(Edge branch) 使用两个不同方向的Sobel算子计算图像梯度,以获取边缘并增强组件的纹理。

上下文分支(Context branch):使用残差块在获取远程依赖之前和之后处理特征,并且通过残差学习跳跃连接传递丰富的低频信息。第一个残差块将特征的通道从3变为32,第二个残差块将特征的通道从32变为3。捕捉场景中的全局信息对低级视觉任务(如低光增强)有益。

边缘分支(Edge branch):Sobel算子是一种结合了高斯滤波器和差分求导的离散算子。它通过计算梯度近似来寻找图像的边缘。在水平和垂直方向上使用Sobel算子,通过卷积滤波器重新提取边缘信息,并利用残差来增强信息的传递。这样可以进一步提升图像的纹理特征。

DPM的详细信息如下图:
在这里插入图片描述

2-3 Low-Frequency Enhancement Filter

在每个尺度的component中,低频分量包含图像中大部分的语义信息,它们是检测器预测的关键信息。为了丰富重建图像的语义,本文提出了低频增强滤波器(LEF)来捕捉component中的低频信息。假设component f ∈ Rh×w×3,首先通过一个卷积层将其转化为f ∈ Rh×w×32。接着使用动态低通滤波器来捕捉低频信息,并使用平均池化进行特征过滤,只允许低于截止频率的信息通过。不同语义的低频阈值是不同的。借鉴Inception的多尺度结构,采用了自适应平均池化,尺寸分别为1×1、2×2、3×3、6×6,并在每个尺度的末尾使用上采样来恢复特征的原始大小。不同核大小的平均池化形成了一个低通滤波器。

LEF的详细信息如下图:
在这里插入图片描述

3 Experiments

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/shanglianlm/article/details/132808775