OCR软件介绍

中文识别:清华文通TH-OCR XP(8.0);汉王文本王5800;尚书七号OCR。 
英文识别:ABBYY FineReader70pro;Cuneiform pro v6;Scansoft OmniPage SE;Scansoft PaperPort v9.0。 
中英文混合识别:清华文通TH-OCR XP(8.0);汉王文本王5800;尚书七号OCR。 
中文识别:汉王文本王5800更好一些。 
中英文混合识别方面:TH-OCR XP(8.0)识别率更高一些,汉王文本王5800稍差一些,尤其是o与0识别出错时更多,但版面还原和纯中文识别率比较好。 
纯英文识别方面:Cuneiform pro v6识别速度最快(宣传的能达到99.96%),ABBYY FineReader70pro版面还原识别率比较好;Scansoft PaperPort v9.0处理图像能力强。 
以上目前网上都有破解版本。
 
清华文通TH-OCR9.0和汉王文本王6800目前网上都没有破解版本。
gocr:属于GPL的一个项目,从2000年到2013年,最新版本是GOCR0.50,识别率不高;
ocrad:也属于GPL的一个项目
tesseract:原本由惠普开发的图像识别类库tesseract-ocr已经更新到3.02, 就是最近Google支持的那个OCR。原先是惠普写的,现在Open source了。1.03版本以前是在sourceforge上发布,现在的更新版本到google-code上了,据说曾经的图像识别能力排名第三。从3.0以上的版本开始支持中文识别,可以自己根据需求训练字库,如果用tesseract整体那一套代码识别会比较慢。

TypeReader是一款由南开大学机器智能研究所的王庆人教授领头开发的西文识别软件,已经畅销二十多年,曾经连续三年拿到识别率冠军。


注:信息不准的请及时纠正,谢谢。

猜你喜欢

转载自blog.csdn.net/cxf7394373/article/details/19672471