文字识别云服务使用记录

最近,在做完OpenHarmony 3516开发板拍照的功能以后,下一步就需要研究一下目前又哪些AI云服务可用,可以实现从图片中识别文字,于是做了如下记录:

华为云:

文字识别服务的产品介绍:图解文字识别_文字识别 OCR_产品介绍_华为云

目前开通了一个一年的试用,每天有500次的免费调用。

尝试使用了通用文字识别,手写文字识别。试用方式:首先先在在线体验模拟调用https://apiexplorer.developer.huaweicloud.com/apiexplorer/sdk?product=OCR&api=RecognizeHandwriting

然后使用postman调用restAPI:  首先需要获取token(认证鉴权_文字识别 OCR_API参考_如何调用API_华为云),然后再调用通用文字识别,手写文字识别服务。

体验反馈:

1.手写文字识别不准,即使是用手写文字识别服务。咨询了官方,说是文字必须写的很工整,要求写字体尽量越接近正楷。。。。

2.因OpenHarmony开发使用的是c++,然而c++ sdk依赖了好几个库,暂时不知道该如何写GN,一起编译进来,目前只能使用OpenHarmony原生的libcurl来调用rest http接口

3.这个token返回,居然是从返回的header获取(认证鉴权_文字识别 OCR_API参考_如何调用API_华为云),目前还不知道如何使用libcurl调用。。。

百度云

文字识别服务:OCR文字识别_免费试用_图片转文字-百度AI开放平台

使用课程:百度云智教育

API文档说明:https://cloud.baidu.com/doc/OCR/s/1k3h7y3db

使用方式,仍然是先使用AK/SK调用获取token,然后使用token调用文字识别服务。我测试了通用文字识别(高精度版)这个服务

 体验反馈:

1.比华为云稍准一些,但我手写的一个汉字,还是没识别出来。看样子确实写的太丑了。

2.撇开所谓安全不说,百度云的接口设计得更方便使用一些。一是体现在获取token接口得返回,那么token就是返回json的一个属性,不像华为云那样,把token放在header里返回。二是文字识别返回,识别的文字解析也很方便,而华为云的返回内容非常复杂。也许因为,我目前只使用libcurl+jsoncpp这些简单的c++类库调用,所以希望接口使用必须简单把

3.主页上写,支持私有化部署方案,离线识别SDK,但需要有企业认证,无法体验

阿里云

猜你喜欢

转载自blog.csdn.net/sd2131512/article/details/122372787