La API de Baidu Smart Cloud llama a PythonSDK

Esta es una biblioteca de Python para las funciones de IA parcialmente abiertas de Baidu Cloud. Es principalmente una función ORC, que puede realizar reconocimiento de texto en varios archivos de imagen, incluidas matrículas, texto escrito a mano, texto general, detección de rostros, comparación de rostros y estadísticas de tráfico.

Puede proponer más funciones, y esta biblioteca se desarrollará lentamente en el futuro.

Con esta biblioteca, puede llamar fácilmente a la API de Baidu Cloud OCR y devolver el resultado del reconocimiento en forma de json. Puede utilizar diferentes API según sus necesidades para obtener resultados de reconocimiento más precisos o más rápidos.

Además, esta biblioteca también proporciona la función de reconocimiento de texto de la versión URL, que puede reconocer directamente las imágenes de la red.

Instrucciones

1. Instalar la biblioteca

Instalar usando pip:

pip install baiducloud
  1. Preparar clave API y clave secreta

2. Preparar la clave API y la clave secreta

Antes de usar la API OCR de Baidu Cloud, debe ir a la consola de Baidu Cloud para solicitar la clave API y la clave secreta.

3. Inicializa la clase baiducloud

Importe la clase baiducloud en su código e inicialícelo con la clave API y la clave secreta:

from baiducloud import baiducloud

api_key = "your_api_key"
secret_key = "your_secret_key"

bc = baiducloud(api_key, secret_key)

4. Usa Python para desarrollar tu programa

Ejemplo 1. Reconocimiento de matrículas

result = bc.orc_license_plate("image.jpg")
print(result)

El resultado devuelto es un json

Ejemplo 2. Reconocimiento de texto usando la versión URL

result = bc.orc_license_plate_url("https://example.com/image.jpg")
print(result)

Nota: cuando utilice la versión URL del método de reconocimiento de texto, debe asegurarse de que la URL de la imagen sea de acceso público.

Ejemplo 3. Uso de la comparación de rostros

result = bc.face_compare("https://example.com/image.jpg""https://example.com/image1.jpg")
print(result)

Por supuesto, hay más métodos de uso, puede consultar los detalles baiducloud > main.py, los métodos de uso son similares y la documentación se actualizará más adelante.

entorno de construcción

El siguiente es el entorno de uso real de mi robot, puede hacer una referencia:

#百度云 车牌识别
def baiduyun_orc_traffic_plate(img_path):
    bc = baiducloud.baiducloud(sqlite.search_API("百度云应用API_Key"), sqlite.search_API("百度云应用Secret_Key"))
    response_data = bc.orc_license_plate(img_path)
    number = response_data['words_result']['number']
    color = response_data['words_result']['color']
    return "车牌号:"+number+"\n颜色:"+color

#百度云 车牌识别——URL版
def baiduyun_orc_traffic_plate_url(img_url):
    bc = baiducloud.baiducloud(sqlite.search_API("百度云应用API_Key"), sqlite.search_API("百度云应用Secret_Key"))
    response_data = bc.orc_license_plate_url(img_url)
    number = response_data['words_result']['number']
    color = response_data['words_result']['color']
    return "车牌号:"+number+"\n颜色:"+color

#百度云 手写文字识别
def baiduyun_orc_handwriting(img_url):
    bc = baiducloud.baiducloud(sqlite.search_API("百度云应用API_Key"), sqlite.search_API("百度云应用Secret_Key"))
    response_data = bc.orc_handwriting_url(img_url)
    words_result = response_data['words_result']
    words = ""
    for i in words_result:
        words += i['words']+"\n"
    return words[:-1]

#百度云 通用文字识别 高精度
def baiduyun_orc_accurate_basic(img_url):
    bc = baiducloud.baiducloud(sqlite.search_API("百度云应用API_Key"), sqlite.search_API("百度云应用Secret_Key"))
    response_data = bc.orc_accurate_basic_url(img_url)
    words_result = response_data['words_result']
    words = ""
    for i in words_result:
        words += i['words']+"\n"
    return words[:-1]

#百度云 通用文字识别
def baiduyun_orc_general_basic(img_url):
    bc = baiducloud.baiducloud(sqlite.search_API("百度云应用API_Key"), sqlite.search_API("百度云应用Secret_Key"))
    response_data = bc.orc_general_basic_url()
    words_result = response_data['words_result']
    words = ""
    for i in words_result:
        words += i['words'] + "\n"
    return words[:-1]
#百度云 人脸检测
def baiduyun_face_check(img_path):
    bc = baiducloud.baiducloud(sqlite.search_API("百度云应用API_Key"), sqlite.search_API("百度云应用Secret_Key"))
    response_data = bc.face_detect(img_path)
    if response_data['error_code'] != 0:
        return response_data['error_msg']
    else:
        return "检测到"+str(response_data['result']['face_num'])+"张人脸"
#百度云 人脸对比
def baiduyun_face_contrast(img_path,img_path1):
    bc = baiducloud.baiducloud(sqlite.search_API("百度云应用API_Key"), sqlite.search_API("百度云应用Secret_Key"))
    response_data = bc.face_compare(img_path,img_path1)
    if response_data['error_code'] != 0:
        return response_data['error_msg']
    else:
        return "两张人脸相似度为:"+str(response_data['result']['score'])+"%"

#百度云 人流量
def baiduyun_person_num(img_path):
    bc = baiducloud.baiducloud(sqlite.search_API("百度云应用API_Key"), sqlite.search_API("百度云应用Secret_Key"))
    response_data = bc.person_num(img_path)
    return "图片中人流量为:"+str(response_data['person_num'])

Por supuesto, la escritura es un poco desordenada, pero debería ser comprensible.

おすすめ

転載: blog.csdn.net/Moxin1044/article/details/128506945