论文笔记:Occlusion-free Face Alignment: Deep Regression Networks Coupled with De-corrupt Auto-Encoders

原文地址:
https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Zhang_Occlusion-Free_Face_Alignment_CVPR_2016_paper.pdf

  • 论文方法整体框架图

    论文方法整体框架图

  • 基本方法流程

    1. 使用深度回归网络(DR)预测人脸形状 一共三层,前面两层是非线性隐藏层,最后一层是线性回归层。
    2. 使用去遮挡自编码网络(DA)对当前形状进行遮挡区域恢复(去除遮挡物。
    3. 恢复后人脸再次作为深度回归网络的输入进行下一轮的预测,反复迭代。

phi 是特征提取函数,基于形状索引的sift特征
Si实际形状 S是初始形状,通过普通人脸检测获得

  • 基本思想:损坏的部分可以从冗余的图像的部分中恢复。

  • 深度回归网络预测人脸形状

这里写图片描述

目的:特殊化人脸到形状的非线性映射
训练以确定wm和bm参数
fm是第m层的非线性函数
aq是隐藏层q的响应

  • 自编码网络恢复遮挡区域

这里写图片描述

将68个人脸坐标点划分为7个组成部分,针对每一部分设计自编码网络
g:将输入人脸x映射到隐藏表示y
h:将隐藏表示y映射回输入人脸x

将恢复图片gx与被遮挡图片(原图)比较,像素之间差异大于阈值的被看作是遮挡像素,超过30%为遮挡像素的区域被看作是遮挡区域

  • 级联深度回归网络与自编码网络

这里写图片描述

重复三次1 2 两个步骤,形成级联结构,联合每一段的输出,得到最终的人脸形状。
在每次级联之后得到恢复人脸,后再用f*来预测形状增量,累加增量得到最终形状。

猜你喜欢

转载自blog.csdn.net/qq_30019237/article/details/78945516