OCR框架整理

泰比ABBYY OCR SDK开发包

Asprise OCR

1. OCR简介

OCR（Optical Character Recognition）——是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率，是OCR最重要的课题。（摘自百度百科）

简言之，OCR是一种可以将图片格式信息转换为可编辑文本的技术，而Asprise OCR是一种内嵌高性能OCR引擎、支持快速开发图片识别系统的软件组件，允许开发者使用多种语言，如VB，VB.NET，VC++，VC.net，C#，Java，Delphi等。

2. Asprise OCR的特性

-易用

-高准确率

-支持条形码识别

-高识别速度

-保持原文档格式

-支持多平台

3. Asprise OCR的安装与开发环境的配置

3.1 为便于在开发的系统中使用Asprise OCR的功能，毋庸置疑，第一步需要正确安装，安装步骤如下：

1）官网下载Asprise OCR SDK，http://asprise.com/product/ocr，可选择跟所用开发语言匹配的SDK。

2）解压SDK

3) 拷贝dll文件至%PATH% 路径，如Windows下，可拷贝至C:\Windows\System32

4）运行解压文件中的可执行文件9来验证安装是否成功

至此，安装完毕，过程相当简易。

3.2 配置开发环境

Asprise OCR支持多种开发语言，而各种开发语言的环境配置大同小异。由于本文采用CSharp语言，且无需为其提供额外的环境配置，故，在此不再赘述环境配置的过程，建议参考官网介绍。

4. Asprise OCR API

为完成各种OCR工作，需对Asprise OCR API做简要介绍。

[string] OCR([string]imagePath, [int] imageFileType)

注：精确图像文件路径及格式，该功能将以字符串形式返回图片内容，如果类型参数设置为-1，Asprise OCR将自动决定文件格式。Asprise

OCR支持的图片格式较广泛，如.bmp,.ico,.jpg,.jpeg,.png,.pic,.jng,.gif等多达30种图片格式。

[string] OCRpart([string]imagePath, [int] imageFileType, [int] startX, [int] startY, [int] width, [int]height)

注：图片的部分区域实施OCR任务，其中(startX, startY)对应图像的左上方区域，(width, height)对应区域的宽度和高度。

[string]OCRBarCodes([string] imagePath, [int] imageFileType)

注：识别图片中的条形码，当有多个条形码时，会以换行符分割

[string]OCRpartBarCodes([string] imagePath, [int] imageFileType, [int] startX, [int]startY, [int] width, [int] height)

注：识别图片中条形码的部分区域

6. 总结

至此，关于AspriseOCR的介绍已经介绍完毕，感兴趣的朋友可以去官网继续查找资料、学习，本人只是出于好奇，顺便粗浅的研究一下，抛砖引玉罢了。

另外，Asprise OCR不支持中文，对英文及验证码等图片的抗干扰能力尚且不足，例如文字扭曲，图片较多噪点会大大降低识别的准确度，这可能也是需要继续加强的地方吧。

http://asprise.com/royalty-free-library/java-ocr-source-code-examples-demos.html

泰比ABBYY OCR SDK开发包

猜你喜欢