人脸关键点检测之TSRN (Deep Regression Architecture with Two-Stage Re-initialization)

2017年的CVPR

1. Introduction

pipeline:
这里写图片描述
首先是全局阶段(整张脸)
(1)对人脸进行re-initialize,把它变成一个规范的形状。如(a)处理后,人脸变正了。
(2)进行一个粗精度的回归

然后是局部阶段
(3)对人脸的不同部分进一步进行re-initialize,变成规范的状态
(4)分别对每一部分再次进行回归

实验中,在300-W和AFLW人脸关键点检测数据集上表现都很666.

2. Our Two-stage Re-initialization Deep Regression Model

2.1 Global stage

对原始image,使用face detector检测出一个粗略的bbox。
与以前的算法不同(以前都是直接在这个bbox内做回归),本文首先对人脸框进行旋转缩放平移等操作
然后再进行回归。

2.1.1 Global Re-initialization Subnetwork

利用一个CNN结构来预测变换参数(网络也是经过不断迭代训练得出的),
这里写图片描述
然后对人脸框进行变换,旋转平移拉伸等。
这里写图片描述
效果如图:
这里写图片描述

2.1.2 Global Regression Subnetwork

5个卷积层+3个FC
使用欧氏距离计算损失

2.2 Local stage

将face分为4部分:左眼、右眼、鼻子、嘴巴
这里写图片描述

2.2.1 Local Re-initialization Subnetwork

网络只有一个FC层
input:every single part
output:transformation parameters
然后对每个部分进行变换
如图:
这里写图片描述

2.2.2 Local Regression Subnetwork

进行位置的精修

2.3 Implementation Details

激活函数:PReLU

猜你喜欢

转载自blog.csdn.net/leewanzhi/article/details/80268090
今日推荐