OCR测试——阴影和角度

测试目的:测试图片中阴影和拍摄图片的角度对文字识别的影响。

一、测试图片选择:

1. 阴影

1)图片中阴影占比:

①没有阴影;②阴影占 1/4 左右;③阴影占 1/2 左右;④阴影占 3/4 左右;⑤文字完全被阴影遮住。

2)阴影方向:

①横向;②纵向。

2. 拍摄角度

1)竖直方向上:

①45度;②90度;③135度。

2)水平方向上:

①45度;②90度;③135度。

二、测试结果(图片对比)

1. 阴影

1)横向阴影

①没有阴影(v_2)

没有阴影(v_3)

召回率:0.9399 / 1.0000

准确率: 0.9642 / 0.9351

耗时:1.819s / 1.206s

竞品:               

②阴影占 1/4 左右(v_2) 

阴影占 1/4 左右(v_3) 

召回率:0.9957 / 0.9528

准确率:0.9671 / 0.9124

耗时: 2.042s / 0.838s

竞品:

③阴影占 1/2 左右(v_2)

阴影占 1/2 左右(v_3)

召回率:0.9399 / 1.0000

准确率:0.9634 / 0.9183

耗时:2.039s / 1.340s 

竞品:

④阴影占 3/4 左右(v_2)

阴影占 3/4 左右(v_3)  

召回率:0.9957 / 1.0000

准确率:0.9717 / 0.9149

耗时:2.442s / 0.707s

竞品:

⑤文字完全被阴影遮住(v_2)

文字完全被阴影遮住(v_3)

召回率:0.9914 / 1.0000

准确率:0.9688 / 0.9185

耗时:1.881s / 1.208s

竞品:

2)纵向阴影

①没有阴影(v_2)

没有阴影(v_3)

召回率:0.9399 / 1.0000

准确率:0.9642 / 0.9351

耗时:1.820s / 1.211s

竞品:

②阴影占 1/4 左右(v_2)

阴影占 1/4 左右(v_3)

召回率:0.9957 / 1.0000

准确率:0.9608 / 0.9267

耗时: 1.746s / 1.247s

竞品:

③阴影占 1/2 左右(v_2)

阴影占 1/2 左右(v_3)

召回率:0.9957 / 0.9571

准确率:0.9630 / 0.9219

耗时:2.021s / 1.132s

竞品:

④阴影占 3/4 左右(v_2)

阴影占 3/4 左右(v_3)

召回率:0.9957 / 1.0000

准确率:0.9659 / 0.9158

耗时:2.306s / 0.756s

竞品:

⑤文字完全被阴影遮住(v_2)

文字完全被阴影遮住(v_3)

召回率:1.0000 / 1.0000

准确率:0.9610 / 0.9218

耗时:1.822s / 1.864s

竞品:

2. 拍摄角度

1)竖直方向

①45度(v_2)

45度(v_3)

召回率:0.9914 / 0.9142

准确率:0.9697 / 0.9203

耗时:2.480s / 0.763s

竞品:

②90度(v_2)

90度(v_3)

召回率:1.0000 / 0.9571

准确率:0.9673 / 0.9316

耗时:1.872s / 0.835s

竞品:

③135度(v_2)

135度(v_3)

召回率:0.9099 / 0.9914

准确率:0.9678 / 0.9099

耗时:3.642s / 0.953s

竞品:

2)水平方向

①45度(v_2)

45度(v_3)

召回率:0.9957 / 1.0000

准确率:0.9718 / 0.9161

耗时:1.956s / 0.671s

竞品:

②90度(v_2)

90度(v_3)

召回率:1.0000 / 0.9571

准确率:0.9674 / 0.9316

耗时:1.872s / 0.835s

竞品:

③135度(v_2)

135度(v_3)

召回率:1.0000 / 1.0000

准确率:0.9698 / 0.9186

耗时:1.417s / 0.599s

竞品:

三、测试结果数据对比

1. 阴影

1)横向

v_2 召回率 准确率 耗时
没有阴影 0.9399 0.9642 1.819s
1/4 阴影 0.9957 0.9671 2.042s
1/2 阴影 0.9399 0.9634 2.039s
3/4 阴影 0.9957 0.9717 2.442s
完全阴影 0.9914 0.9688 1.881s
v_3 召回率 准确率 耗时
没有阴影 1.0000 0.9351 1.206s
1/4 阴影 0.9528 0.9124 0.838s
1/2 阴影 1.0000 0.9183 1.340s
3/4 阴影 1.0000 0.9149 0.707s
完全阴影 1.0000 0.9185 1.208s

2)纵向

v_2 召回率 准确率 耗时
没有阴影 0.9399 0.9642 1.819s
1/4 阴影 0.9957 0.9608 1.746s
1/2 阴影 0.9957 0.9630 2.021s
3/4 阴影 0.9957 0.9659 2.306s
完全阴影 1.0000 0.9610 1.822s
v_3 召回率 准确率 耗时
没有阴影 1.0000 0.9351 1.206s
1/4 阴影 1.0000 0.9267 1.247s
1/2 阴影 0.9571 0.9219 1.132s
3/4 阴影 1.0000 0.9158 0.756s
完全阴影 1.0000 0.9218 1.864s

2. 拍摄角度

1)竖直方向

v_2 召回率 准确率 耗时
45度 0.9914 0.9697 2.480s
90度 1.0000 0.9673 1.872s
135度 0.9099 0.9678 3.642s
v_3 召回率 准确率 耗时
45度 0.9142 0.92034 0.763s
90度 0.9571 0.9316 0.835s
135度 0.9914 0.9099 0.953s

2)水平方向

v_2 召回率 准确率 耗时
45度 0.9957 0.9718 1.956s
90度 1.0000 0.9673 1.872s
135度 1.0000 0.9698 1.417s
v_3 召回率 准确率 耗时
45度 1.0000 0.9161 0.671s
90度 0.9571 0.9316 0.835s
135度 1.0000 0.9186 0.599s

四、总结

1. 阴影

1)无阴影时,可以检测一整行为一个文本框;在阴影覆盖区域,一行文字会被识别为多个文本框。

2)横向阴影和纵向阴影对文本检测识别的影响的区别不大。

3)阴影对文本检测和识别的影响不大。

2. 角度

1)水平方向上拍摄角度的不同,对检测识别的影响不大。

2)竖直方向上拍摄角度的不同,对检测识别的影响较大。

3. 模型

1)召回率:v_3 略优于 v_2 。

2)准确率:v_2 优于 v_3 。

3)耗时:v_2 大于 v_3 (v_3 的速度比 v_2 快)。

4)竞品的召回率和准确率较高(几乎都是1.0000),偶尔会出现连字现象;竞品检测识别速度大概在 5~6 秒(包含网络传播时延)。

猜你喜欢

转载自blog.csdn.net/qq_40206924/article/details/127573771