人脸识别之人脸检测（十六）--Cascade CNN - 代码天地

人脸识别之人脸检测（十六）--Cascade CNN

其他 2018-06-02 05:17:26 阅读次数: 0

转自：https://blog.csdn.net/xzzppp/article/details/51692907

论文：A Convolutional Neural Network Cascade for FaceDetection

1、简介

CascadeCNN是对经典的Violajones方法的深度卷积网络实现，是一种检测速度较快的人脸检测方法。使用VGA图片，在CPU上达到14FPS，GPU上达到100FPS，在FDDB上达到85.1%的召回率和87%的准确率。

2 、总体框架

下图是该方法的整个流程示意图，可以看出是3阶级联。

级联结构中有6个CNN，3个CNN用于人脸非人脸二分类，另外3个CNN用于人脸区域的边框校正。给定一幅图像，12-net密集扫描整幅图片，拒绝90%以上的窗口。剩余的窗口输入到12-calibration-net中调整大小和位置，以接近真实目标。接着输入到NMS中，消除高度重叠窗口。下面网络与上面类似。

12-net, 24-net and48-net的CNN结构图

2.1 net网络

12-net：使用12×12的检测窗口，以步长为4，在W×H的图片上滑动，得到检测窗口。实际应用中，将图像尺度变换为金字塔结构，每层都作为12-net输入。12-net可以拒绝90%以上的窗口，大大减小了下级网络的负担。

24-net：在12-net的基础上，将24×24的图片缩放到12×12，输入到12-net全连接层，与12-net并联，最后一起输出到24-net全连接层。

2.2 calibration-net网络

该网络用于窗口校正，使用三个偏移变量：Xn:水平平移量，Yn:垂直平移量，Sn:宽高比缩放。候选框口(x,y,w,h)中，(x,y)表示左上点坐标，(w,h)表示宽和高。

我们要将窗口的控制坐标调整为：

这项工作中，我们有N=5×3×3=45种模式。偏移向量三个参数包括以下值：

Sn：(0.83,0.91,1.0,1.10,1.21)

Xn：(-0.17,0,0.17)

Yn：(-0.17,0,0.17)

同时对偏移向量三个参数进行校正。

校正网络的结构如下图所示：

Cascade CNN一定程度上解决了传统方法在开放场景中对光照、角度等敏感的问题，但是该框架的第一级还是基于密集滑动窗口的方式进行窗口过滤，在高分辨率存在大量小人脸（tiny face）的图片上限制了算法的性能上限。

3、检测结果

在FDDB数据集上进行测试，每阶段的检测窗口个数和召回率如图所示：

猜你喜欢

转载自blog.csdn.net/app_12062011/article/details/80533782

人脸识别之人脸检测（十六）--Cascade CNN

人脸检测之Cascade CNN

人脸识别之人脸检测（十八）--TinyFace(S3FD,SSH,HR,RSA,Face R-CNN,PyramidBox)

2.6CNN实战之人脸关键点识别

人脸识别 Lightened CNN

cnn 实现人脸性别检测

dlib 调用cnn人脸检测

基于CNN的人脸性别、年龄识别

人脸识别tensorflow_cnn_face_recognize

人脸识别CNN网络微调流程

cnn 卷积神经网络人脸识别

基于CNN、Opencv、tensorboard的人脸识别

CNN人脸识别之模型创建

cnn检测人脸是否佩戴口罩

人脸识别之人脸检测（十四）--MTCNN

人脸识别之人脸检测（一）--综述

Keras搭建CNN进行人脸识别系列(三)--利用haar级联检测器识别出人脸

人脸识别之人脸检测（十九）--人脸检测综述（2018.2）

人脸识别之表情识别（二）--基于CNN分类

人脸识别之表情识别（五）--MBP+CNN

使用CNN做数字识别和人脸识别

Python学习案例之人脸检测识别

python之人脸检测与识别初探

实战演习（五）——人脸识别（CNN）简单演练

用CNN卷积神经网络进行人脸识别

Keras搭建CNN进行人脸识别系列(一)

使用卷积神经网络（CNN）做人脸识别

人脸识别03_轻量型CNN

基于CNN卷积神经网络的人脸识别

使用CNN进行人脸关键点识别

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)