paddle ocr框架识别数字问题和解决方案

识别出的字符串重复

情况1:检测错误,同一个字符串被两次检测到
比如 “12 方案 ”
被识别成:“12” “2方案”,这种可以通过x坐标交叉并且第一个结果最后一个字符与第二个结果第一个字符相同判断

情况2: 识别错误,11被识别成111
可能是文本周围空白区域太多,通过轮廓裁剪出文本区域,det设置为False可以提高识别率

该行字符串太长,识别不完全

识别结果为空

resize图片的高宽比为1:10可以提高检测和识别率
适当padding,图片上下增加像素

只检测到部分字符串

同上,但是仍然可能漏掉一些文字没识别出来

单个数字识别率差

通过轮廓裁剪出数字区域,det设置为False可以提高识别率

猜你喜欢

转载自blog.csdn.net/weixin_38235865/article/details/132321123