边缘检测论文笔记 - 代码天地

边缘检测论文笔记

其他 2019-02-19 21:50:50 阅读次数: 0

六月北京 | 高性能计算之GPU CUDA培训

6月22-24日

640?wx_fmt=jpeg

三天密集式学习快速带你入门阅读全文 >

正文共1856个字，8张图，预计阅读时间12分钟。

摘要：这篇论文提出了一种基于FCNN和深度监督网络的新的边缘检测算法HED，它解决了两个重要的问题，1）整体图片的训练和预测，2）多尺度多层级的特征学习。HED能实现端到端的训练，输入一个图片，输出对应的边缘图片。

下图中的图c即为HED输出的边缘检测结果，d-f是不同side layer（后面会具体提到）的输出，g-i是Canny边缘检测器的输出。可以看到HED效果明显更好。

640?wx_fmt=png

b47c51c8-7caf-4cbe-a67b-6a61babefb3c.png

算法总览

640?wx_fmt=png

3847bf0c-cd4b-41e4-8dd4-135248e31956.png

HED的思想来源于多尺度&多级别学习的概念，有的是通过内在网络结构的多尺度学习，有的是通过缩放扭曲图片进行的，上图的a-d就是作者列出的一些现有的多尺度&多级别学习的神经网络。前两个网络的问题是只有单一的输出层，所以只有一个预测结果，而在边缘检测中获得多个预测结果然后将所有的边缘映射平均是更有利的。

而图c中的方法一般更多用于不基于深度学习的方法，因为它会大大削减学习系统的预测效率。而作为图a的变种，图d中的方法分别训练多个不同层级的网络，但是这样会导致需要数倍的训练数据。而本论文提出的HED方法就改进自图d中的方法，如图e所示，它将同一个深度学习网络的不同层级侧面输出（side output）。

损失函数

首先，我们定义了针对侧面输出的图片级别的边缘损失函数，其中G(m)是根据侧面输出层（side output layer）m上采样到原始图像尺寸得到的图形，每一个侧面输出层都和一个分类器相连，我们将这些分类器的参数记为w，将其它网络参数统统记为W，G是grondtruth，△是用来计算预测边缘映射和ground truth之间差距的能量函数，αm是用来控制每一个独立的侧面输出层的损失函数占比的超参数。

640?wx_fmt=png

f703bcab-69dd-4203-bd44-98e752ff8126.png

然而在一张图片中，百分之九十的区域都是非边缘，为了解决边缘和非边缘不平衡的问题，论文引入了一个类平衡圈子β，用它来定义我们在公式（1）中用到的类平衡交叉熵函数△：

640?wx_fmt=png

6b3b50c8-7eaf-4e06-a3d2-52fa8455c1b5.png

其中I，I-和I+分别代表总像素，非边缘像素和边缘像素的个数。βj=I-/I(Ij是正样本），1-βj=I+/I(Ij是负样本）。

网络结构

在这篇论文中作者选择了VGG16作为基础网络，对它进行了修剪和更改。

文中提到做了以下更改：

A）连接侧输出层（side output layer）到每一个阶段的最后一个卷积层在，分别为conv1 1，conv3 conv2 2，3，3 conv4，conv5 3。侧输出层被实现为具有内核大小1和输出数1的卷积层。因此每一个卷积层的感受野的大小是相同的相应的对应侧输出层。

B）去掉了VGG第五层的池化层和全连接层。

修剪完之后的网络如下图所示。

640?wx_fmt=png

f00428d6-c6fd-4d73-b027-4d90045cc31c.png

权重混合数层

为了最好地利用本论文提出的结构中的每个侧输出层的结果，我们增加了一个“权重混合层”用来将所有的侧输出层的预测结果连接到一起并且在训练的过程中学习混合权重。我们将混合权重记为h，混合权重层的损失函数如下：

640?wx_fmt=png

2ad5a9b5-6939-4451-8181-2bf62c9f171c.png

所以总体的损失函数为：

640?wx_fmt=png

8cd9b33f-de83-464d-9ab4-5a18e94a35ea.png

同时，论文还特别探讨了隐藏监督层的必要性，即之前在侧输出层进行的卷积操作；因为会有人觉得有了权重混合层之后之前的隐藏监督层就没有必要了。

但是实际上，隐藏输出层是非常重要的，因为论文提出的网络的主要特点是，每一个网络层都应该充当一个单一的网络，负责在一定的范围内产生一个边缘映射。论文也提供了一组对比图，从图中可以看出，在没有隐藏监督层的情况下，边缘不连续，并且丢失了很多重要边缘。如下：

640?wx_fmt=png

bf0ceac9-69c8-49f4-a1da-e1f8210e5e52.png

总结：这篇论文提出的HED方法进行边缘检测还是很可靠的，它提出的这种从深度网络的每一层引一个侧面输出出来再进行混合的思想也可以借鉴。

原文链接：https://www.jianshu.com/p/a3f62bd25d57

查阅更为简洁方便的分类文章以及最新的课程、产品信息，请移步至全新呈现的“LeadAI学院官网”：

www.leadai.org

请关注人工智能LeadAI公众号，查看更多专业文章

640?wx_fmt=jpeg

大家都在看

640.png?

LSTM模型在问答系统中的应用

基于TensorFlow的神经网络解决用户流失概览问题

最全常见算法工程师面试题目整理（一）

最全常见算法工程师面试题目整理（二）

TensorFlow从1到2 | 第三章深度学习革命的开端：卷积神经网络

装饰器 | Python高级编程

今天不如来复习下Python基础

猜你喜欢

转载自blog.csdn.net/leadai/article/details/80683251

边缘检测论文笔记

【边缘检测】HED论文笔记

[论文笔记] 契约论与边缘计算

边缘大发彩票快三源码下载出售检测论文笔记

弯曲文本检测PSENet论文笔记

目标检测——Focal loss 论文笔记

时序行为检测论文笔记（一）：CDC

时序行为检测论文笔记（三）：TCN

【论文笔记】人脸检测窗口选择办法 NMS convnet

论文笔记 ---语音关键词检测方法综述

有关深度造假检测的近期论文笔记

行人检测论文笔记汇总（含代码地址）

论文笔记 Android恶意软件检测即家族分类

DB文本检测算法论文笔记

【论文笔记】基于深度学习的视觉检测及抓取方法

ASLFeat（CVPR 2020）特征点检测论文笔记

【论文笔记】ZFNet论文笔记

Kalman论文笔记

RFCN论文笔记

论文笔记

SEDA论文笔记

【论文笔记】SPPnet

SSD论文笔记

ResNet论文笔记

论文笔记模板

CRNN论文笔记

DenseNet 论文笔记

MobileNets 论文笔记

ResNeXt 论文笔记

Xception 论文笔记

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)