MTCNN(四)人头检测数据集参数调整

版权声明:转载注明出处:邢翔瑞的技术博客https://blog.csdn.net/weixin_36474809/article/list/1 https://blog.csdn.net/weixin_36474809/article/details/82892682

一、原始结构上的参数调整

1.  ROI与黑白框

ROI

 

 

mAP(%)

不加ROI

 

 

50.06

[0 352]

[100 260]

白框

45.93

 

 

黑框

51.72

[0 352]

[100 270]

黑框

52.40

[0 352]

[100 280]

白框

43.29

 

 

黑框

53.49

彻底舍弃白框ROI

ROI

 

 

mAP(%)

不加ROI

 

 

50.06

[0 352]

[100 260]

黑框

51.72

[0 352]

[100 270]

黑框

52.40

[0 352]

[100 280]

黑框

53.49

[0 352]

[100 290]

黑框

54.08

[0 352]

[100 300]

黑框

54.40

 

[100 305]

 

53.93

[0 352]

[100 310]

黑框

54.43

 

[100 315]

 

54.38

[0 352]

[100 320]

 

53.01

[0 352]

[100 330]

 

51.87

 

[10 310]

 

 

 

[20 310]

 

56.07

 

[30 310]

 

56.19

 

[40 310]

 

57.70

 

[45 310]

 

57.36

 

[50 310]

 

57.19

 

[60 310]

 

56.64

 

[70 310]

 

 

 

[80 310]

 

55.54

 

[90 310]

 

54.99

 

[100 310]

 

54.43

 

[110 310]

 

53.58

 

[150 310]

 

42.62

确定了右边的框为[40 310]

[]

[40 310]

 

 

57.70

[10 352]

 

 

 

56.69

[10 320]

 

 

 

56.69

[30 352]

 

 

 

54.34

[50 352]

 

 

 

48.57

[0 280]

 

 

 

56.59

[0 300]

[40 310]

 

 

57.70

[0 320]

 

 

 

57.70

[0 340]

 

 

 

57.70

ROI参数固定为[40 300]

2.  minsize face to detect

Minisize of face to detect

mAP(%)

20

57.70

30

59.98

33

59.79

34

59.74

35

60.37

36

59.42

37

60.00

40

57.28

50

51.66

ROI定为

[0 300]

[40 310]

MiniSize of face定为 35

scale stride

测试stride

初始0.7

60.37

0.9

60.91

0.8

60.56

0.5

59.24

二、新网络结构的参数调整

(pnet与rnet更改,onet为原版onet代码)

ROI=[0,300,40,310]

2.1 minsize的调整

scale stride=0.9

minsize mAP(%)
35 61.84
32 ~=62
30 63.08
27 ~=62
25 62.43

2.2 scale stride

scale stride mAP(%)
0.95 60.97
0.9 63.08
0.85 61.94
0.7 59.78

三、新结构

只有3×3的卷积,后两层padding都为same.

有7层卷积

3.1 关于nms的阈值。

可以增大相应的阈值来增大查准率precision,减小recall

关于非极大值抑制的阈值

非极大值抑制的方法是:假设有6个矩形框,根据分类器的类别分类概率做排序,假设从小到大的概率 分别为A、B、C、D、E、F。
(1)从最大概率矩形框F开始,分别判断A~E与F的重叠度IOU是否大于某个设定的阈值;
(2)假设B、D与F的重叠度超过阈值,那么就扔掉B、D;并标记第一个矩形框F,是我们保留下来的。
(3)从剩下的矩形框A、C、E中,选择概率最大的E,然后判断E与A、C的重叠度,重叠度大于一定的阈值,那么就扔掉;并标记E是我们保留下来的第二个矩形框。
就这样一直重复,找到所有被保留下来的矩形框。

阈值越大,则融合更不容易,产生的备选框越多

阈值设置 mAP(%)

inter scale nms: 0.5

pnet nms阈值:0.7

rnet nms阈值:0.7

onet nms阈值:0.7

62.97

inter scale nms: 0.5

pnet nms阈值:0.7

rnet nms阈值:0.9

onet nms阈值:0.7

64.65

inter scale nms: 0.5

pnet nms阈值:0.7

rnet nms阈值:0.9

onet nms阈值:0.9

58.05

inter scale nms: 0.7

pnet nms阈值:0.9

rnet nms阈值:0.9

onet nms阈值:0.7

65.08

inter scale nms: 0.4

pnet nms阈值:0.6

rnet nms阈值:0.8

onet nms阈值:0.7

62.92

inter scale nms: 0.5

pnet nms阈值:0.5

rnet nms阈值:0.7

onet nms阈值:0.6

60.73

对阈值调参,考虑到运行速度,nms的阈值暂时选用

增大阈值会增大precision,减小recall

inter scale nms: 0.5

pnet nms阈值:0.7

rnet nms阈值:0.7

onet nms阈值:0.7

Three thresholds for pnet, rnet, onet mAP(%)
[0.8, 0.8, 0.8] 62.97
[0.9, 0.8, 0.9] 63.09
[0.8, 0.8, 0.9] 62.29
[0.9, 0.9, 0.95] 60.57
[0.9, 0.8, 0.95] 62.66
[0.8, 0.8, 0.95] 62.29

猜你喜欢

转载自blog.csdn.net/weixin_36474809/article/details/82892682