OCR标注方法

虽然说标注工作不是由算法工程师负责的,但是如何标注,标注要求却是由算法工程师指导标注人员去实施的,如果标注工作人员标注的数据有问题,就会出现模型训练不收敛的问题,导致很多问题的出现,所以标注要求很重要,在一开始的时候就要整理好标注要求,讲清楚标注要求,这样就能减少标注工作的反复无用功。

接下来就说一下具体的标注规范:

框的规范

  1. 同一行数据,最好标在一个框里。

  1. 根据目标的形态,灵活选取横向、竖向和倾斜的方式,将文本按照四点标注的画法框选

  1. 框要贴合文本,不要有过多的空余区域

  1. 斜文本也要尽力贴合。

像这种弯曲的文本,就不要自觉聪明的框成这样,完全就是错误的标注方式。

而是应该让框更加贴合文本去框。

标注顺序

1、有语意时:标注框的四点顺序要按照文本语意的顺序去标。

2、无语意时:按照阅读顺序横向文本-从左至右、竖向文本-从上至下、倾斜文本-从上至下的顺序标矩形的四个点。

模糊字和变形字

1、模糊不清的文本需要舍弃(模糊字体不要联想上下文去看)

2、只要字体轮廓整体清晰,部分笔画模糊转写了可以给到合格

3、模糊/变形字的空格代替使用规则

(1)正常文本中模糊字变形字3个(即≥3个),则整行舍弃

(2)正常文本中间出现的1个(连续2个或连续3个)模糊变形字体,均只用一个空格代替

(3)句首/尾模糊字/舍弃字,可以单独框选舍弃,可以用空格代替

(4)可当做模糊和变形字处理,用空格代替的其他情况:重叠导致无法识别的文字、不符合

转写规则的遮挡缺失文字等

遮挡字

1、未被遮挡字需要转写,遮挡处空格代替,不能整行舍弃

2、遮挡宽度及画框规则

(1)被遮挡处距离未达到3个(即<3)个字符时,未被遮挡的部分必须整行一起框选。如图2框

法错误

(2)被遮挡处距离达到3个(≥3)个字符时,未被遮挡的部分必须分框转写。

(3)纯英文文本中,被遮挡部分间隔以最宽的字母的为参照

(4)中英文混合文本,被遮挡部分间隔以最宽的汉字为参照

3、文字缺失

(1) ①~③三点规则,图片边缘,图片中间均适用

(2)①剩余部分≥1/2,且人为客观可识别的文字正常框选转写;

(3) 剩余部分≥1/2,但人为客观无法识别的文字或一些简单的文字,少了一横、一竖、一撇

or截断文字有歧义必须舍弃;

(4)②剩余部分<1/2,且文字很小,舍弃框难画时,可不处理(舍弃可过);剩余部分<1/2,

但)

(5)③剩余部分<1/5,的较大文字,可不处理

(6)④左右/上下结构的文字,存在遮盖情况转写规则:

存在遮盖,但不影响整字识别,必须整字转写;

存在遮盖,影响整字识别,未被遮盖的一半不能识别为一个字时,必须整字舍弃;

存在遮盖,影响整字识别,未被遮盖的一半能识别为一个字,但被遮盖的一半,剩余部分≥1/5

时,必须整字舍弃;

存在遮盖,影响整字识别,未被遮盖的一半能识别为一个字,且被遮盖的一半,剩余部分<1/5

时,必须转写该半文字,剩余部分可舍弃,可不处理

猜你喜欢

转载自blog.csdn.net/wangmengmeng99/article/details/129064255
OCR