上海大学验证码识别(二)

上次对验证码进行了分割,接下来是非常辛苦的活了,因为我们要手动的对搜集到的数据进行分类,然后保存到一个表格里作为训练集的数据,之前我根据例程看到他的训练集有四万多行训练集,而我今天手动分类分了半天也才一百多行,我感觉这样我的准确率一定不会太高的,但是姑且把代码和后续的东西先写出来,暂时看看效果,看看准确率能达到多少,毕竟训练集的数据非常少。

接下来的过程:

  1. 对分割的图片进行分类存储

  2. 将分类存储的图片整合为csv文件作为训练集

  3. 读取训练集

  4. 整理数据

  5. 构建卷积神经网络模型

  6. 运行卷积神经网络模型

  7. 测试准确率

分类存储



这里要补充一点,很多字符从下载的验证码里并没有找到,因为学校生成验证码的时候考虑到了我们可能看错数据,比如1和l,0和o,都没有生成,这无疑减轻了我们分类的压力。

格式归一化并整合到csv


图:格式(图片的长和宽)归一化处理


图:整合到csv并保存

读取训练集



构建卷积神经网络模型。



初始化并运行网络


测试准确率


不到一分钟就跑玩了,数据量太小了,很明显,准确率很低。。。以后有比较多的数据的时候再去做吧。。懒得手动分类了。

猜你喜欢

转载自www.cnblogs.com/aoru45/p/9748491.html
今日推荐