论文阅读：FaceBoxes: A CPU Real-time Face Detector with High Accuracy - 代码天地

论文阅读：FaceBoxes: A CPU Real-time Face Detector with High Accuracy

其他 2018-07-28 12:20:17 阅读次数: 0

2个挑战：

1)在杂乱背景下人脸视角大的变化需要人脸检测器精准的解决复杂人脸和非人脸的分类问题。

2)较大的搜索空间和人脸尺寸进一步增加了时间效率的需要。

传统方法效率高但在人脸大的视角变化下精度不够，基于CNN的方法精度高但速度很慢。

受到Faster R-CNN的RPN以及SSD中多尺度机制的启发，便有了这篇可以在CPU上实时跑的FaceBoxes。

（1）RDCL：Rapidly Digested Convolutional Layers,加速计算

缩小输入的空间大小：为了快速减小输入的空间尺度大小，在卷积核池化上使用了一系列的大的stride,在Conv1,Pool1,Conv2,Pool2上stride分别是4,2,2,2,RDCL的stride一共是32，意味着输入的尺度大小被快速减小了32倍。
选择合适的kernel size：一个网络开始的一些层的kernel size应该比较小以用来加速，同时也应该足够大用以减轻空间大小减小带来的信息损失。Conv1,Conv2和所有的Pool分别选取7*7,5*5,3*3的kernel size。
减少输出通道数：使用C.ReLU来减少输出通道数。

（2）MSCL：Multiple Scale Convolutional Layers,丰富感受野，使不同层的anchor离散化以处理多尺度人脸

　　将RPN作为一个人脸检测器，不能获取很好的性能有以下两个原因：

RPN中的anchor只和最后一个卷积层相关，其中的特征和分辨率在处理人脸变化上太弱。
anchor相应的层使用一系列不同的尺度来检测人脸，但只有单一的感受野，不能匹配不同尺度的人脸。

　　为解决这个问题，对MSCL从以下两个角度去设计：

- 　　Multi-scale design along the dimension of network depth.如下图，anchor在多尺度的feature map上面取，类似SSD。
- Multi-scale design along the dimension of network width.使用inception模块，内部使用不同大小的卷积核，可以捕获到更多的尺度信息。

（3）Anchor densification strategy：

猜你喜欢

转载自www.cnblogs.com/ocean1100/p/9381429.html

论文阅读：FaceBoxes: A CPU Real-time Face Detector with High Accuracy

快速人脸检测论文阅读系列之《FaceBoxes:A CPU Real-time Face Detector with High Accuracy》

《Real-Time Rotation-Invariant Face Detection with Progressive Calibration Networks》论文阅读

CPU Real-time Face Detection and Alignment-68 using MTCNN

【论文】ICNet for Real-Time Semantic Segmentation on High-Resolution Images

《Background Matting V2：Real-Time High-Resolution Background Matting》论文笔记

论文笔记--PCN:Real-Time Rotation-Invariant Face Detection with Progressive Calibration Networks

Real-time 2D Multi-Person Pose Estimation on CPU:Lightweight OpenPose 论文精读

Apache Druid (incubating) is a high performance real-time analytics database

Real-Time High-Resolution Background Matting

Edge Computing Application： Real-Time Face Recognition Based on Cloudlet

论文《Real-time 2D Multi-Person Pose Estimation on CPU: Lightweight OpenPose》阅读，基于openpose的轻量级cup实时运行实现

【论文阅读-Bidding】《Optimal Real-Time Bidding for Display Advertising》

论文阅读|YOLACT: Real-time Instance Segmentation

KinectFusion: Real-Time Dense Surface Mapping and Tracking论文阅读

[论文理解] LFFD: A Light and Fast Face Detector for Edge Devices

Volumetric 3D Mapping in Real-Time on a CPU

论文阅读_人脸检测：S3FD: Single Shot Scale-invariant Face Detector

WORLD声码器:A Vocoder-Based High-Quality Speech Synthesis System for Real-Time Applications

Advantages of Single-Molecule Real-Time Sequencing in High-GC Content Genomes

High Waits On Real-time Descriptor Latch From 12.1.0.1 (Doc ID 2382299.1)

【Tracking】Real-Time Camera Tracking: When is High Frame-Rate Best

快速人脸验证--MobileFaceNets: Efficient CNNs for Accurate Real-time Face Verification on Mobile Devices

论文阅读：Real-time anomaly detection system for time series at scale

Efﬁcient ConvNet for Real-time Semantic Segmentation论文解读

YOLACT : Real-time Instance Segmentation论文解读

Rethinking BiSeNet For Real-time Semantic Segmentation 论文翻译

论文解读：DETRs Beat YOLOs on Real-time Object Detection

DETRs Beat YOLOs on Real-time Object Detection论文详解

PoseNet: A Convolutional Network for Real-Time 6-DOF Camera Relocalization论文阅读

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)