Python 调用火山引擎——文字识别功能 进行对图片的文字识别

首先需要去官网下载代码库

火山引擎官方代码仓库见volc-sdk-python,GitHub - volcengine/volc-sdk-python

这里有我们需要调用的库,可直接下载放到自己的本地

把其中的volcengine文件直接下载放到我们本地

然后就是我们的代码环节

首先需要将我们需要进行文字识别的图片转base64编码

然后需要我们火山引擎账号的AK和SK,这个在火山引擎控制台可查看,这里有需要帮助的可以直接咨询火山引擎的客服

最后的话就是进行文字的提取

话不多说,直接看代码

import base64

from volcengine.visual.VisualService import VisualService

img_path = 'D:\sdcard\lanya\ceshi.jpg'  # 图片

with open(img_path, 'rb') as f:
    image_data = f.read()
    base64_data = base64.b64encode(image_data)  # 图片转base64编码
visual_service = VisualService()
visual_service.set_ak('这里是你的AK')
visual_service.set_sk('这里是你的SK')
form = dict()
form["image_base64"] = base64_data

resp = visual_service.ocr_normal(form)
imageText = resp.get('data').get('line_texts')  # 获取文字
print(imageText)
num_list_string = " ".join('%s' % id for id in imageText)
res = num_list_string.find("车辆")  # 寻找图片里的车辆这两个字
print(res)

下面是我要识别的图片

运行代码结果如下:

 

结果就是我们想要的结果啦!

这里会有一个小坑:

脚本运行时如果有报错,报错在Util.py,就需要下载crypto,如果有这个,就去将这个文件夹名改成大写的C,下载完应该是crypto,改成Crypto。

改完继续运行 还有报错的话会提示(忘记截图了)

这时候我们需要下载pycryptodome

下载命令pip install pycryptodome

然后再运行就OK不会报错啦

猜你喜欢

转载自blog.csdn.net/suixing6/article/details/128116206