深度学习_人脸检测_级联卷积神经网络

其他 2020-01-16 16:27:17 阅读次数: 0

一.Cascade CNN的框架结构

1.Cascade CNN的整体框架

在这里插入图片描述

级联结构中有6个CNN，3个CNN用于人脸非人脸二分类，另外3个CNN是边界校正网络，用于人脸区域的边框校正。给定一幅图像，12-net密集扫描整幅图片，拒绝90%以上的窗口。剩余的窗口输入到12-calibration-net中调整大小和位置，以接近真实目标。接着输入到NMS中，消除高度重叠窗口。

2.12-net、24-net、48-net的网络框架结构

在这里插入图片描述

这三个网络的结构大致相同，不同之处在于其读入的图片分辨率和网络的复杂度是逐级递增的。前面的简单网络拒绝了绝大部分非人脸区域，将难以分辨的交由下一级更复杂的网路以获得更准确的结果。

想要在CNN结构下实现V-J瀑布级联结构，就要保证瀑布的前端足够简单并有较高的召回率且能够拒绝绝大部分非人脸区域，将图片缩放可以满足需求，比例为12/F，24/F，48/F，F为检测人脸的最小尺寸，这样对于一张800 * 600的图片，检测尺寸为40 * 40的人脸，窗口移动步伐为4个像素，那么会产生（（800 * 12/40 - 12）/ 4 + 1） * （（600 * 12/40 - 12） / 4 + 1） = 2494个窗口。这样不仅使得窗口数量变少而且窗口的缩放也使得前期的CNN结构更加简单，实现了级联的思想。

另外在24-net和48-net的全连接层还会连接该图像缩放后在前一层网络的全连接输出，这么做的目的是为了检测更小的人脸，可以较明显的提高识别率。

3.12-calibration-net、24-calibration-net、48-calibration-net的网络框架结构

在这里插入图片描述

这三个网络用于校正人脸检测框的边界，往往得分最高的边界框并非最佳结果，经过校准后能更好的定位人脸。其校正原理非常简单：对原图做45次变换，然后每个变换后的边界框都有一个得分，对于得分高于某个设定的阈值时，将其加进原边界，最后取平均，就是最佳边界框。

45次变换如下所示：

在这里插入图片描述

其中S_n是尺寸的缩放比例，X_n和Y_n是坐标移动比例，取值分别如下所示：

在这里插入图片描述

二.Cascade CNN人脸校验模块原理

该网络用于窗口校正，使用三个偏移变量：Xn：水平平移量，Yn：垂直平移量，Sn：宽高比缩放。候选框口（x,y,w,h）中，（x,y）表示左上角点坐标，（w,h）表示宽和高。

我们要将窗口的控制坐标调整为：
在这里插入图片描述

在这项工作中，我们有N = 5 * 3 * 3 = 45种模式。偏移向量三个参数包含以下值：

$Sn：(0.83,0.91,1.0,1.10,1.21)$

$Xn：(-0.17,0,0.17)$

$Yn：(-0.17,0,0.17)$

同时对偏移向量三个参数进行校正：

在这里插入图片描述

三.训练样本的准备

人脸样本
非人脸样本

四.级联的优势

最初阶段的网络可以比较简单，判别阈值可以设得宽松一点，这样就可以在保持较高召回率的同时排除掉大量的人非人脸窗口。
最后阶段网络为了保证足够的性能，因此一般设计的比较复杂，但由于只需要处理前面剩下的窗口，因此可以保证足够的效率。
级联的思想可以帮助我们去组合利用性能较差的分类器，同时又可以获得一定的效率保证。

五.Cascade CNN的主要贡献

Cascade CNN是一种非常快速的人脸检测算法。对传统的VGA图像检测在CPU上可以达到14FPS，在GPU上可以达到100FPS。
在FDDB上达到了当年最好的分数。
我们先用CNN网络在低分辨率下对输入图像进行评估，达到快速剔除非人脸区域的目的，并在高分辨率下仔细处理具有挑战性的区域，以达到准确检测的目的。
设计了边界校正网络用于更好的定位人脸位置。

发布了95 篇原创文章 · 获赞 37 · 访问量 3414

私信关注

猜你喜欢

转载自blog.csdn.net/Rocky6688/article/details/103918939

深度学习_人脸检测_级联卷积神经网络

深度学习（十五）基于级联卷积神经网络的人脸特征点定位

深度学习_人脸检测_基于多任务卷积神经网络（MTCNN）

MTCNN-将多任务级联卷积神经网络用于人脸检测和对齐

MTCNN：将多任务级联卷积神经网络用于人脸检测和校准

深度学习（十五）基于级联卷积神经网络的人脸特征点定位基础知识（六）KD-Tree快速最近邻搜索

MTCNN（Multi-task convolutional neural networks）将多任务级联卷积神经网络用于人脸检测和对齐

使用卷积神经网络（CupCnn）训练人脸检测模型

基于卷积神经网络CNN模型的人脸检测

【深度学习】卷积神经网络入门

深度学习与卷积神经网络

深度学习【一】卷积神经网络

【深度学习】卷积神经网络原理

深度学习之卷积神经网络

深度学习——卷积神经网络认知

深度学习资源---卷积神经网络

【深度学习】：卷积神经网络(CNN)

深度学习（1）卷积神经网络

【深度学习】卷积神经网络

深度学习--卷积神经网络

深度学习笔记——卷积神经网络

深度学习(六)-卷积神经网络

深度学习-卷积神经网络

[ 深度学习 ] —— 卷积神经网络（CNN）

深度学习-卷积神经网络笔记

《深度学习》笔记-卷积神经网络

深度学习——卷积神经网络

深度学习笔记------卷积神经网络

深度学习：CNN 卷积神经网络

深度学习_卷积神经网络（4）

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)