OCR识别系列之一-----文档字符识别 - 代码天地

OCR识别系列之一-----文档字符识别

编程语言 2023-07-22 20:02:51 阅读次数: 0

假如输入系统的图像是一页文本，那么识别时的第一件事情是判断页面上的文本朝向，因为我们得到的这页文档往往都不是很完美的，很可能带有倾斜或者污渍，那么我们要做的第一件事就是进行图像预处理，做角度矫正和去噪。

然后我们要对文档版面进行分析，每一行进行行分割，把每一行的文字切割下来，最后再对每一行文本进行列分割，切割出每个字符，将该字符送入训练好的OCR识别模型进行字符识别，得到结果。

但是模型识别结果往往是不太准确的，我们需要对其进行识别结果的矫正和优化，比如我们可以设计一个语法检测器，去检测字符的组合逻辑是否合理。比如，考虑单词Because，我们设计的识别模型把它识别为8ecause，那么我们就可以用语法检测器去纠正这种拼写错误，并用B代替8并完成识别矫正。这样子，整个OCR流程就走完了。从大的模块总结而言，一套OCR流程可以分为：

版面分析 -> 预处理-> 行列切割 -> 字符识别 -> 后处理识别矫正

比如在对电表数字进行识别时，考虑到电表上的字体较少（可能就只有阿拉伯数字），而且字体很统一，清晰度也很高，所以识别难度不高。针对这种简单的识别场景，我们首先考虑的识别策略当然是最为简单和暴力的模板匹配法。我们首先定义出数字模板（0~9），然后用该模板滑动匹配电表上的字符，这种策略虽然简单但是相当有效。

猜你喜欢

转载自blog.csdn.net/wangmengmeng99/article/details/129724117

OCR识别系列之一-----文档字符识别

OCR技术系列之一字符识别技术总览

OCR字符识别检测

光学字符识别OCR

OCR光学字符识别

Halcon OCR字符识别

【OCR一】字符识别技术总览（转）

OCR识别系列之一----技术实现

OCR识别系列之一-----基础介绍

光学字符识别OCR-2

光学字符识别OCR-3

光学字符识别OCR-4

OCR技术（光学字符识别）

【源码】光学字符识别（OCR）仿真

OCR （光学字符识别技术）安装

OCR字符识别效果测试

用Transformer实现OCR字符识别！

OCR-字符识别笔记

【halcon】halcon字符识别——OCR

锋利的javaCV文字识别篇之一：基于tesserac ocr检测识别图片文字，不仅跨平台还支持英文中文简体繁体等各种字符识别

OCR识别系列之一-----场景文字识别

光学字符识别OCR-6 光学识别

字符识别--字符识别模型

OCR （Optical Character Recognition，光学字符识别）

Optical Character Recognation(OCR) 光学字符识别

光学字符识别OCR-8 综合评估

光学字符识别OCR-7语言模型

OCR光学字符识别技术及其应用场景

光学字符识别引擎 tesseract-ocr 简介

OpenCV+OCR 图像处理字符识别原理及代码

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)