关于OCR的单个字符的匹配问题

OCR的原理是先对文字进行分割,去除变形,去噪声,然后对单个字符进行分类或者比对,看结果是否相同。
 
对单个字符的分类比对,步骤如下:
  1. 灰度化:目的是去除掉彩色图像信息,只保留一个维度的像素点信息。
  1. 二值化:设置一个阈值,将灰度的图片处理成黑白的图片,大于某个值的时候即为白色,小于某个值的时候即为黑色。
  1. 噪声去除:去除外部的噪声点。
  1. 倾斜矫正:把拍出来的照片的倾斜矫正。
       5.  字符切割:把成段或者成行的字符切割成单个字符。
       6.  字符识别:把切割好的单个字符识别出来。
       7.  版面还原。
   8.  后处理,校对。
 
文字识别的分类:
  1.     直接使用他人平台与引擎。
  2.     特征提取,输入分类器。(大量的特征工程)
  3.     深度学习,CNN。(不需要特征提取,但是需要大量的样本数据。)
  4.     字符模板匹配法。(适用于简单的场景,字体统一,清晰度高,不需要建模,简单有效)
 
模板匹配的方法:

猜你喜欢

转载自www.cnblogs.com/lhongly/p/11105949.html