百度云 OCR 识别图片验证码 - 代码天地

百度云 OCR 识别图片验证码

其他 2019-06-27 13:41:32 阅读次数: 0

操作系统：Mac OS

Python版本：3.7.2

OCR：百度云

遇到的问题：

API测试过程中，遇到API Resopnse 为图片验证码的情况，需要对图片进行识别得到text code，进行断言或者下一步操作。

验证码图片：
在这里插入图片描述
直接使用OCR识别图片结果为：

/usr/local/bin/python3.7 /Users/test.py
-----> hci

Process finished with exit code 0

由于图片带有干扰线且文本不规则，所以出现识别错误的情况。

解决方案：

对原图片进行“灰度转换”处理
二值化
百度云OCR识别（点击查看如何使用）

Python代码实现

from PIL import Image
from aip import AipOcr

# 填入百度OCR API 提供的参数
config = {
    'appId': '---',
    'apiKey': '---',
    'secretKey': '---'
}

client = AipOcr(**config)


""" 1.将图片进行降噪处理, 通过二值化去掉后面的背景色并加深文字对比度 """
def processing_image(img_file, standard=127.5):
    img = Image.open(img_file)

    # 灰度转换
    _image = img.convert('L')

    # 二值化: 根据阈值 standard, 将所有像素都置为 0(黑色) 或 255(白色), 便于接下来的分割
    pixels = _image.load()
    for x in range(_image.width):
        for y in range(_image.height):
            if pixels[x, y] > standard:
                pixels[x, y] = 255
            else:
                pixels[x, y] = 0
    return _image


def get_file_content(file_path):
    with open(file_path, 'rb') as fp:
        return fp.read()


""" 2.将处理后的图片另存为b.png """
image_b = processing_image('a.png')
image_b.save('b.png')
# image_b.show()

""" 3. 通过百度OCR识别b.png"""
image = get_file_content('b.png')
result = client.basicAccurate(image)

text = '\n'.join([w['words'] for w in result['words_result']])
text = text.replace(' ', '')
print('----->', text)

结果打印

/usr/local/bin/python3.7 /Users/test.py
----->  hxciV

Process finished with exit code 0

大功搞成！

猜你喜欢

转载自blog.csdn.net/lan_yangbi/article/details/89251721

百度云 OCR 识别图片验证码

使用百度ocr接口识别验证码

百度OCR验证码识别连接

python使用百度OCR图片验证码

Python使用百度OCR接口进行验证码图像识别

OCR java百度云银行卡识别

OCR java百度云身份证识别

[python]百度云批量调用ｏｃｒ接口识别

百度云OCR文字识别使用

基于百度云的OCR识别（Python）

百度智能云OCR文字识别的坑

百度OCR识别图片

python 爬虫--利用百度图片处理OCR识图API进行验证码识别，并通过python、requests进行网站信息爬取（二）实战

python 爬虫--利用百度图片处理OCR识图API进行验证码识别，并通过python、requests进行网站信息爬取（一）

selenium+百度OCR完成登录验证码文字识别并且完成模拟登录操作并获取cookie

【一天一个Python小案例】验证码识别（基于百度OCR）

百度OCR文字识别

基于百度OCR的文字识别

OCR识别验证码

Android 图片文字识别DEMO（基于百度OCR）

基于百度OCR的图片文字识别

ava实现百度云OCR文字识别高精度OCR识别身份证信息

selenium+云打码+百度ocr爬取360的电话号码标记

【验证码识别】百度拖动旋转图片角度验证码

Tesseract-OCR识别图片验证码

C#百度OCR文字识别Demo

[百度OCR]BDOcr.getText(识别图上的文字）

百度OCR文字识别image format error问题

调用百度OCR模块进行文字识别

百度OCR 文字识别 Android安全校验

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)