很多网站登录都需要输入验证码,如果要实现自动登录就不可避免的要识别验证码。我查了些资料,并用python实现了基于KNN的验证码识别。
1. 安装两个库:
pip3 install opencv-python
pip3 install numpy
2. 原理:
a. 图片处理 - 对图片进行降噪、二值化处理
b. 切割图片 - 将图片切割成单个字符并保存
c. 人工标注 - 对切割的字符图片进行人工标注,作为训练集
d. 训练数据 - 用KNN算法训练数据
e. 检测结果 - 用上一步的训练结果识别新的验证码