云上+AI(2)-通用文字识别

通用文字识别

一般这个功能用于多场景、多语种、高精度的整图文字检测和识别服务。好一点的文字识别可识别中、英、日、韩等20种语言。 具体也看场景,对于个人来说就是个翻译。 就比如现在微信上有扫一扫翻译的功能。 给个图识别图上的文字; 给个英文翻译成中文等等。

当然每个产品也分精细度,一般的功能如下:

高精度版

在通用文字识别(标准版)的基础上,提供更高精度的识别服务,支持更多语种识别(丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语),并将字库从1w+扩展到2w+,能识别所有常用字和大部分生僻字。

标准版

对图片中的文字进行检测和识别,支持中、英、法、俄、西、葡、德、意、日、韩、中英混合等10种语言,并支持中、英、日、韩四语种的类型检测。

高精度含位置版

在通用文字识别(高精度版)的基础上,返回文字在图片中的位置信息,方便进行版式的二次处理。

标准含位置版

扫描二维码关注公众号,回复: 14453941 查看本文章

在通用文字识别(标准版)的基础上,返回文字在图片中的位置信息,方便进行版式的二次处理

上边简单聊了聊基础场景,但是其实不仅仅是简单的翻译,还有以下其他使用场景:

拍照/截图识别

使用通用文字识别技术,实现拍照文字识别、相册图片文字识别和截图文字识别,可应用于搜索、书摘、笔记、翻译等移动应用中,方便用户进行文本的提取或录入,有效提升产品易用性和用户使用体验。

内容审核与监管

自动提取图像中的文字内容,结合文本审核技术识别违规内容,提示相应风险,协助进行违规处理,可应用于电商广告审核、舆情监管等场景,帮助企业有效规避业务风险。

视频内容分析

检测识别视频中的字幕、标题、弹幕等文字内容,并根据文字位置判断文字类型,可应用于视频分类和标签提取、视频内容审核、营销分析等场景,有效提升内容分类、检索的效率。

纸质文档电子化

识别提取各类医疗单据、金融财税票据、法律卷宗等纸质文档中的文字信息,并可基于位置信息进行比对、结构化处理,提高信息录入、存档、检索的效率。

猜你喜欢

转载自blog.csdn.net/m0_66194642/article/details/123679992
今日推荐