图像识别之验证码识别

移动开发 2023-07-28 22:16:35 阅读次数: 0

导语

自动化测试中，例如使用selenium测试web页面，在定位元素、识别元素、确认元素内容时会遇到，目标元素不可被获取、目标元素是图片无法获取到文本、目标元素动态变化无法定义预期值等，遇到以上种种便阻碍了测试脚本的进行，所以选择图像识别来实现以上无法完成的动作。
在这里插入图片描述

原理及环境搭建

在原有的python环境外（作者使用python3.7），实现图像识别首先安装tesseract后端引擎，用于支撑OCR识别，主要涉及两个环境（截图、OCR识别）。

tesseract

由于Textshot的OCR识别需要调用tesseract后端引擎，所以，首先需要安装tesseract。
1.Windows版安装可以直接访问下载链接[https://sourceforge.net/projects/tesseract-ocr/]。
配置两个环境变量一个path一个TESSDATA_PREFIX。
（1）path下新增一个path为Tesseract-OCR所在路径，例如：F:\SocTest\dist\Tesseract-OCR。
（2）新建 TESSDATA_PREFIX 放入tessdata所在路径，例如F:\SocTest\dist\Tesseract-OCR\tessdata。
（3）配置完成需要重启电脑。
2.Mac下可以使用Homebrew进行安装(brew install tesseract)

截图工具安装

截图工具是我们经常会用到的一种工具，Python中有很多可以实现截图的库或者函数，例如，pyscreenshot或者PIL中的Image函数，只需要把鼠标框选的起点和终点坐标传给grab方法就可以实现截图功能。
可以通过pip install 工具例如：pip install pyscreenshot来进行安装。

图像识别验证码Demo实现

图像识别函数

创建一个SocImage.py文件，引入os、PIL-Image、pytesseract、time，函数需要传入浏览器browser、element为主要参数，以传入元素获取整个验证码所在的左上角x、y坐标轴，再通过获取元素的宽和高计算得出另外三个点的坐标轴，实现截图并命名为screen，图片准备完毕后，调用pytesseract的image_to_string函数将图片转换为字符串，最终将识别出的字符串返回给测试脚本函数，代码样例如下：
在这里插入图片描述

测试脚本函数

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_36616956/article/details/128929339

图像识别之验证码识别

Python图像识别验证码处理之opencv切割验证码

图像识别（2）—验证码篇

图像识别（3）---验证码篇

图像识别（1）---验证码篇

图像识别-图片和验证码标注工具

图像识别 - 提取验证码信息

Python使用pytesseract进行验证码图像识别

【Python爬虫】验证码图像识别 --- 第三弹 (极验验证码识别)

【Python爬虫】验证码图像识别 --- 第二弹 (打码平台介绍)

图片识别之验证码识别

验证码/OCR图像识别预处理（去噪）

验证码图像识别-(PIL|tesserocr)和百度AI开放识图

Selenium利用Python图像识别解决验证码问题

tesseract-orc训练结合python3图像识别验证码

tesseract图像识别验证码：安装使用和避免坑

Python笔记：网站验证码的图像识别技术实战

vaptcha、京东、58等手势验证码图像识别与轨迹提取（思路）

Python使用百度OCR接口进行验证码图像识别

Python图像处理之图片验证码识别

Python图像处理之验证码识别

动态HTML处理和机器图像识别-----案例：尝试对验证码进行机器识别处理

识别验证码

验证码识别

验证码识别

机器学习之验证码识别

CNN之tensorflow验证码识别

PaddlePaddle之验证码识别

Python之验证码识别功能

tensorflow实战之验证码识别

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)