云上+AI（2）-通用文字识别

通用文字识别

一般这个功能用于多场景、多语种、高精度的整图文字检测和识别服务。好一点的文字识别可识别中、英、日、韩等20种语言。具体也看场景，对于个人来说就是个翻译。就比如现在微信上有扫一扫翻译的功能。给个图识别图上的文字；给个英文翻译成中文等等。

当然每个产品也分精细度，一般的功能如下：

高精度版

在通用文字识别（标准版）的基础上，提供更高精度的识别服务，支持更多语种识别（丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语），并将字库从1w+扩展到2w+，能识别所有常用字和大部分生僻字。

标准版

对图片中的文字进行检测和识别，支持中、英、法、俄、西、葡、德、意、日、韩、中英混合等10种语言，并支持中、英、日、韩四语种的类型检测。

高精度含位置版

在通用文字识别（高精度版）的基础上，返回文字在图片中的位置信息，方便进行版式的二次处理。

标准含位置版

扫描二维码关注公众号，回复： 14453941 查看本文章

在通用文字识别（标准版）的基础上，返回文字在图片中的位置信息，方便进行版式的二次处理

上边简单聊了聊基础场景，但是其实不仅仅是简单的翻译，还有以下其他使用场景：

拍照/截图识别

使用通用文字识别技术，实现拍照文字识别、相册图片文字识别和截图文字识别，可应用于搜索、书摘、笔记、翻译等移动应用中，方便用户进行文本的提取或录入，有效提升产品易用性和用户使用体验。

内容审核与监管

自动提取图像中的文字内容，结合文本审核技术识别违规内容，提示相应风险，协助进行违规处理，可应用于电商广告审核、舆情监管等场景，帮助企业有效规避业务风险。

视频内容分析

检测识别视频中的字幕、标题、弹幕等文字内容，并根据文字位置判断文字类型，可应用于视频分类和标签提取、视频内容审核、营销分析等场景，有效提升内容分类、检索的效率。

纸质文档电子化

识别提取各类医疗单据、金融财税票据、法律卷宗等纸质文档中的文字信息，并可基于位置信息进行比对、结构化处理，提高信息录入、存档、检索的效率。