介绍

评价人脸目标检测系统的性能指标

参考下面2010年的人脸数据库文章FDDB 的评价章节

Jain V, Learned-Miller E. Fddb: A benchmark for face detection in unconstrained settings[R]. Technical Report UM-CS-2010-009, University of Massachusetts, Amherst, 2010.

评价

为了建立一个评价检测算法的标准，我们首先对算法的输出指定一些假设：

一个检测结果对应于一个连续的图像区域
任何合并重叠或类似检测所需的后处理都已经完成
每一次检测都对应着一张完整的脸，不多也不少。换句话说，一个检测不能被认为是同时检测两张脸，两个检测不能一起检测一张脸。我们进一步认为，如果一个算法检测到一张脸的多个不相交的部分作为单独的检测，那么只有其中一个属于阳性检测，其余的检测应该被认为是假阳性。

使用S(IOU)来度量一个真值 $l_j$ 和一个检测结果 $d_i$ 之间匹配程度

$S(d_i,l_j)=\frac{area(d_i)\cap area(l_j)}{area(d_i)\cup area(l_j)}$

为了为对应于人脸的图像区域指定比通常使用的矩形区域更精确的注释，我们在对应于这些人脸的像素周围定义了一个椭圆区域。虽然这种表示不像像素级注释那样精确，但它明显地改进了现有数据集中的矩形注释。

为了便于手动标记，我们从对人脸位置的自动猜测开始。为了估计一个人脸区域的椭圆边界，我们首先在图像像素上应用皮肤分类器，它使用它们的色相和饱和度值。接下来，使用MATLAB中的泛洪填充实现来填充结果面区域中的孔。最后，对该区域进行基于矩的拟合，以获得所需椭圆的参数。所有这些椭圆的参数都在最后阶段人工验证和调整。

检测结果和标注之间的匹配

剩下的一个主要问题是如何在一组检测和一组注释之间建立对应关系。
虽然对于给定图像的非常好的结果，这个问题很简单，但是对于大量的误报或多个重叠检测来说，它可能是微妙和棘手的。

下面，我们将匹配标注和检测的问题表述为在二分图中找到最大加权匹配。

图1.二分图中的最大权匹配。我们从检测到的图像区域di的集合到标注为人脸区域的图像区域li的集合进行单射(一对一)映射。结果映射的属性是，它最大化所有检测到的图像区域的累积相似度得分。

$L$ 是标注集合， $D$ 是检测结果集合。我们用点集 $V=L\cup D$ 建立一个图 $G$ 。图上没一个点 $d_i$ 和每一个点 $l_j$ 连接，连接的权重 $w_{ij}=S(d_i,l_j)$ 定义为上述的IOU值。对于每一个检测结果引入一个点 $n_i$ ，表示没有任何标注和该检测结果匹配的情况，这些引入点构成集合 $N$ 。（本质上是为了在使用下面的匈牙利算法时，图 $G$ 总是存在完备匹配）

这时我们有两个集合 $A=D$ ， $B= L \cup N$ ，集合中的元素没有连接，所有边的两个端点都分别位于两个集合中

假设 $num(D)=I,num(L)=J,num(N)=K$

$w_{ij}=S(d_i,l_j)$

$w_{ik}=1,k=i$

匹配的目标定义为

$\max_{M\subseteq E} \sum_{e_{ab}\in M}w_{ab} \\ s.t. \\ \forall a\in A,\exists b\in {B}, a\xrightarrow{M}b\\ \forall b\in B,\not\exists a,a'\in A, a\xrightarrow{M}b\wedge a'\xrightarrow{M}b$