安恒8月赛 MISC 标错的字符 WP

《关于WEB狗在转到RE的过程中两个都不会了只能在MISC混分这件事》

这个题做完发现有非预期解,而且速度快得多。。


先看看题目

在这里插入图片描述
打开一看
在这里插入图片描述

又双叒叕是验证码,而且这个给数据的方式越看越像机器学习。。

那就机器学习一把嗦了吧

用了别人的轮子:https://github.com/nickliqian/cnn_captcha

基本上就是按着人家给者的教程来,就是要改改一些参数

训练完后开本地接口(这些还是在人家的教程里)

然后现在问题是机器学习依然有失误的概率,所以我采用的方法是删除识别正确的图片:

import os
import requests
import json
import re

base_dir = r"C:\Users\shinelon\Downloads\2008245f43dd0625dca\target"

url = "http://127.0.0.1:6000/b"
images = os.listdir(base_dir)
for each in images:
    image_name = each
    title_char = re.search("_([a-z0-9])", image_name).group()[1]
    data = open(base_dir + '\\' + each, 'rb')
    files = {'image_file': (image_name, data, 'application')}
    r = requests.post(url=url, files=files)
    j = json.loads(r.text)
    data.close()
    if j['value'] == title_char:
        os.remove(base_dir + '\\' + each)

整完后:
在这里插入图片描述

这时候直接看就会舒服得多,这时候再找就可以了

PS:找完才发现有非预期解,直接找规律就可以,是7,17,77,177,777,1777,7777。。我死了

PPS:这题的图片给了一堆噪点,以往的验证码用tesseract就可以了,这题唯一的收获就是以后咱碰到这类题心里起码更有谱了(自我安慰ing)

PPPS:要是做题过程中有网页的验证码需要爆破啥的可以试试 PKAV HTTP Fuzzer

猜你喜欢

转载自blog.csdn.net/a709046532/article/details/108227479