Python 调用火山引擎——文字识别功能进行对图片的文字识别

首先需要去官网下载代码库

火山引擎官方代码仓库见volc-sdk-python，GitHub - volcengine/volc-sdk-python

这里有我们需要调用的库，可直接下载放到自己的本地

把其中的volcengine文件直接下载放到我们本地

然后就是我们的代码环节

首先需要将我们需要进行文字识别的图片转base64编码

然后需要我们火山引擎账号的AK和SK，这个在火山引擎控制台可查看，这里有需要帮助的可以直接咨询火山引擎的客服

最后的话就是进行文字的提取

话不多说，直接看代码

import base64

from volcengine.visual.VisualService import VisualService

img_path = 'D:\sdcard\lanya\ceshi.jpg'  # 图片

with open(img_path, 'rb') as f:
    image_data = f.read()
    base64_data = base64.b64encode(image_data)  # 图片转base64编码
visual_service = VisualService()
visual_service.set_ak('这里是你的AK')
visual_service.set_sk('这里是你的SK')
form = dict()
form["image_base64"] = base64_data

resp = visual_service.ocr_normal(form)
imageText = resp.get('data').get('line_texts')  # 获取文字
print(imageText)
num_list_string = " ".join('%s' % id for id in imageText)
res = num_list_string.find("车辆")  # 寻找图片里的车辆这两个字
print(res)

下面是我要识别的图片

运行代码结果如下：

结果就是我们想要的结果啦！

这里会有一个小坑：

脚本运行时如果有报错，报错在Util.py，就需要下载crypto，如果有这个，就去将这个文件夹名改成大写的C，下载完应该是crypto，改成Crypto。

改完继续运行还有报错的话会提示（忘记截图了）

这时候我们需要下载pycryptodome

下载命令pip install pycryptodome

然后再运行就OK不会报错啦

Python 调用火山引擎——文字识别功能 进行对图片的文字识别

首先需要去官网下载代码库

然后就是我们的代码环节

猜你喜欢

Python 调用火山引擎——文字识别功能进行对图片的文字识别