python-使用内置库pytesseract实现图片验证码的识别 - 代码天地

python-使用内置库pytesseract实现图片验证码的识别

其他 2019-11-06 11:50:51 阅读次数: 0

环境准备：

1、安装Tesseract模块

git文档地址：https://digi.bib.uni-mannheim.de/tesseract/

　百度网盘下载地址：

　　链接：https://pan.baidu.com/s/16RoJ19WynWOKI4Zpr0bKzA
　　提取码：5hst

下载后右击安装即可

2、配置环境变量：

　　编辑系统变量里面 path，添加下面的安装路径：D:\Program Files\Tesseract-OCR(填写自己的实际安装路径)

3、安装python的第三方库：　　

　　pip install pillow #一个python的图像处理库，pytesseract依赖
　　pip install pytesseract

4、修改pytesseract.py文件，指定tesseract.exe安装路径

编辑pytesseract.py文件(此步骤必须做，否则运行代码时会报错)：

tesseract_cmd = 'D:\Program Files\Tesseract-OCR'

代码实现

验证码识别方法之一，简单验证码，代码可直接使用

import requests
from PIL import Image
import pytesseract

# 验证码地址
url = "http://cloud.xxxx.com/checkCode?0.7337270680854053"
response = requests.get(url).content
#将图片写入文件
with open('test.png','wb') as f:
    f.write(response)
#识别验证码
#第一步：通过内置模块PIL打开文件
image = Image.open('test.png')
image = image.convert('L')  #转化为灰度图
threshold = 160             #设定的二值化阈值
table = []                  #table是设定的一个表，下面的for循环可以理解为一个规则，小于阈值的，就设定为0，大于阈值的，就设定为1
for i in range(256):
    if i < threshold:
        table.append(0)
    else:
        table.append(1)

image = image.point(table,'1')  #对灰度图进行二值化处理，按照table的规则（也就是上面的for循环）
image.show()
result = pytesseract.image_to_string(image) #对去噪后的图片进行识别
print('图片内容为:',result)

猜你喜欢

转载自www.cnblogs.com/fppblog/p/11804196.html

python-使用内置库pytesseract实现图片验证码的识别

使用python内置库pytesseract实现图片验证码的识别

pytesseract模块验证码图片识别

python -使用pytesseract识别验证码中遇到的问题

Python使用pytesseract进行验证码图像识别

使用pytesseract识别简单验证码

python下调用pytesseract识别某网站验证码

python 爬虫 pytesseract 验证码识别：认识Tesseract

Python - PIL-pytesseract-tesseract验证码识别

Python3 pytesseract识别简单的验证码

python opencv+pytesseract 验证码识别

python爬虫验证码识别模块tesseracr与pytesseract

python -使用pytesseract识别验证码-安装和使用中遇到的问题

python 爬虫 pytesseract 验证码识别：识别拉勾网验证码

用pytesseract识别验证码报错

图形验证码文字识别——pytesseract

爬虫入门之验证码的处理--------------------------pytesseract库的使用

关于 pytesseract模块图片验证码

python 识别图片验证码/滑块验证码准确率极高的 ddddocr 库

python +pytesseract简单失败验证码

python 使用pytesseract图片识别

Python图片验证码的识别

有了这个Python库，免费实现验证码识别

selenium+pytesseract自动识别验证码实现自动健康打卡

python调用pytesseract识别某网站的验证码（实战项目）

python+pillow+pytesseract+Tesseract-OCR验证码识别[转]

python+Selenium+Pytesseract 登录时自动识别验证码

【2020-10-13】 python+pytesseract+CFS验证码识别

Python 3.6 版本 Pytesseract 图像验证码识别 PyCharm 报错FileNotFoundError

Selenium&Pytesseract模拟登录+验证码识别

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)