MTCNN 部分理解

本人是深度学习初学者,本文仅仅是自己对文章的一些个人理解,内容很可能有错,请仔细甄别。

1. P-Net理解。

       如上图,该层网络是将12x12x3的图片作为layer1的输入,经过卷积计算后生成5x5x10的特征图。第一次看到这没有完全理解12x12x3是如何变成5x5x10的,通过查找资料,基本明白了其中的计算过程,个人理解如下:

      layer1的输入是12x12x3,卷积核大小为3x3x3,一共用了10个卷积核,卷积完之后应该是10x10x10的特征图,再经过2x2的池化进行降维最终变成了5x5x10的特征图。

      layer2同理,输入为5x5x10,卷积核大小为3x3x10,卷积核数量是16,该层没有经过池化操作,所以最终生成了3x3x16的特征图。

      layer3同理,输入为3x3x16,卷积核大小为3x3x16,卷积核数量是32,该层没有经过池化操作,所以最终生成了1x1x32的特征图。

      layer4,输入为1x1x32,给了两组不同的卷积核,第一组卷积核大小为1x1x32,卷积核数量为2,

猜你喜欢

转载自blog.csdn.net/ggqhit/article/details/81256648
今日推荐