口述MTCNN

版权声明:xbx https://blog.csdn.net/weiweixiao3/article/details/81324946

MTCNN是多任务级联CNN,能够同时进行人脸检测和关键点检测。

MTCNN网络包含3个级联的CNN,分别叫做P-net,R-net,O-net。
P-net是浅层的CNN,主要用来获取人脸区域的候选窗口和边界框的回归向量,并用该边界框做回归,对候选窗进行校准,然后通过NMS去掉一些重叠的候选框;
R-net是更复杂的CNN(多了一个fc layer),还是通过边界框回归和NMS来排除大量错误重叠窗体;
O-net是更复杂的CNN(比R-met多了一层conv),进一步精化候选框并输出5个关键点。

每个网络都进行3个任务:人脸分类、边框回归和关键点定位。

由粗糙到精细

猜你喜欢

转载自blog.csdn.net/weiweixiao3/article/details/81324946