OCR框架整理

 

泰比ABBYY OCR SDK开发包

Asprise OCR

 

 

1. OCR简介

OCR(Optical Character Recognition)——是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题。(摘自百度百科)

简言之,OCR是一种可以将图片格式信息转换为可编辑文本的技术,而Asprise OCR是一种内嵌高性能OCR引擎、支持快速开发图片识别系统的软件组件,允许开发者使用多种语言,如VB,VB.NET,VC++,VC.net,C#,Java,Delphi等。

 

2. Asprise OCR的特性

-易用

-高准确率

-支持条形码识别

-高识别速度

-保持原文档格式

-支持多平台

3. Asprise OCR的安装与开发环境的配置

3.1 为便于在开发的系统中使用Asprise OCR的功能,毋庸置疑,第一步需要正确安装,安装步骤如下:

1)官网下载Asprise OCR SDK,http://asprise.com/product/ocr,可选择跟所用开发语言匹配的SDK。

2)解压SDK

3) 拷贝dll文件至%PATH% 路径,如Windows下,可拷贝至C:\Windows\System32

4)运行解压文件中的可执行文件9来验证安装是否成功

至此,安装完毕,过程相当简易。

3.2 配置开发环境

Asprise OCR支持多种开发语言,而各种开发语言的环境配置大同小异。由于本文采用CSharp语言,且无需为其提供额外的环境配置,故,在此不再赘述环境配置的过程,建议参考官网介绍。

4. Asprise OCR API

为完成各种OCR工作,需对Asprise OCR API做简要介绍。

[string] OCR([string]imagePath, [int] imageFileType)

注:精确图像文件路径及格式,该功能将以字符串形式返回图片内容,如果类型参数设置为-1,Asprise OCR将自动决定文件格式。Asprise

OCR支持的图片格式较广泛,如.bmp,.ico,.jpg,.jpeg,.png,.pic,.jng,.gif等多达30种图片格式。

 

[string] OCRpart([string]imagePath, [int] imageFileType, [int] startX, [int] startY, [int] width, [int]height)

注:图片的部分区域实施OCR任务,其中(startX, startY)对应图像的左上方区域,(width, height)对应区域的宽度和高度。

 

[string]OCRBarCodes([string] imagePath, [int] imageFileType)

注:识别图片中的条形码,当有多个条形码时,会以换行符分割

 

[string]OCRpartBarCodes([string] imagePath, [int] imageFileType, [int] startX, [int]startY, [int] width, [int] height)

注:识别图片中条形码的部分区域

 

6. 总结

至此,关于AspriseOCR的介绍已经介绍完毕,感兴趣的朋友可以去官网继续查找资料、学习,本人只是出于好奇,顺便粗浅的研究一下,抛砖引玉罢了。

另外,Asprise OCR不支持中文,对英文及验证码等图片的抗干扰能力尚且不足,例如文字扭曲,图片较多噪点会大大降低识别的准确度,这可能也是需要继续加强的地方吧。

 

http://asprise.com/royalty-free-library/java-ocr-source-code-examples-demos.html

猜你喜欢

转载自code.iteye.com/blog/2389833
OCR