Python调用百度OCR接口图片识别转文字

调用要求

请求图片需经过base64编码及urlencode后传入:图片的base64编码指将一副图片数据编码成一串字符串,使用该字符串代替图像地址。您可以首先得到图片的二进制,然后去掉编码头后再进行urlencode。

接口

https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic

代码

from PIL import ImageGrab
import requests
import base64

def ScreenCapture():
    # 识别图片
    request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic"
    f = open('xxx.png', 'rb')
    img = base64.b64encode(f.read())
    params = {"image":img}
    access_token = '将获取到的access_token粘贴到这里'
    request_url = request_url + "?access_token=" + access_token
    headers = {'content-type': 'application/x-www-form-urlencoded'}
    response = requests.post(request_url, data=params, headers=headers)
    if response:
        print (response.json())

# 调用
ScreenCapture()

使用说明

1、xxx.png是本地图片
2、access_token = '将获取到的access_token粘贴到这里'是需要你获取到access_token,有效期30天,你可以缓存到本地文件,每次使用就判断access_token是否还在有效期,如果过期就重新自动获取并再次刷新缓存。

猜你喜欢

转载自blog.csdn.net/weixin_39927850/article/details/125144194