【不正经科普】那些把我逼成人工智障的验证码

上网登录,常常碰见这么一个问题:请证明你不是机器人。

然后,就跳出了一个反人类的验证码,你说第三行第三列那个到底选不选?

(选出所有带路标的矩形)

此外还有,你说红绿灯电线杆到底算不算红绿灯?

这种图片验证码比较高级,还有一种我们更为常见的验证码,它们由字母数字组成。

你倒是告诉我,第一个是小写的“L”,还是大写的“I”,还是数字“1”?

当然,我们可以换一张甚至N张验证码,结果:

wok,到底还让不让我正常登录?

与验证码斗智斗勇好一段时间,鹦鹉先生已经......

好好的验证码,花里胡哨的倒是搞了一大堆。为什么要搞出让人类都怀疑是不是人类的验证码?今天,鹦鹉先生就与大家聊聊把我们快逼成“人工智障”的验证码。

0x00 技术介绍

像前文提到的图片验证码,有一个响亮的英文名字:

简称CAPTCHA,译为:全自动区分计算机和人类的图灵测试。从名字可以看出,这一种技术本质上是区分人类和计算机的。而用白线将图片分割成多块,实际上是一种AI的视觉扫描风格,简单讲,就是“以AI的视角看图片”

作为一个正常人,我们不会以一种支离破碎的角度去感知我们周围的世界。相反,计算机正是将图片进行分割,来识别周围的环境,比如自动驾驶技术。AI 会更关注建筑环境中的事物:比如红绿灯、出租车、骑自行车、消防栓、人行横道等等,这些事物无法像树叶、花朵、溪流这些自然景物一样,给人类带来享受美的愉悦感。

这种“图片切割法”,恰恰是验证码中的常客。然而,这些图片的拍摄角度往往都很微妙,比如下面这一张:

要么就是没人,要么出现的人类,都有点,emmmmm......

实际上,这些照片大多拍摄自正在训练的无人驾驶汽车,所以会让人觉得很别扭。

(出现大颗粒噪点的图片验证码)

0x01 为啥这样

先给出结论:无偿为AI打工。

有一些朋友可能要发牢骚:要被迫证明自己是人类,同时又碰见了愚蠢的验证码(红绿灯杆子是不是红绿灯?),感觉有一种挫败感。

(看见验证码时的你)

实际上,在你点选验证码时,并没有真的向机器证明你是人类,而是在教AI识路。细品一下,当你勾出“汽车”、“红绿灯”或是“斑马线”时,像不像在教AI识图?

2012 年,Google 旗下的 reCAPTCHA 就开始将难辨的文字或是街景中难以识别的门牌和路牌加入验证码,请用户帮忙标注。而 reCAPTCHA 官网也公开说明了这种集众人之力标注数据、训练 AI 的“众包”模式:

可以这么说——你以为你在填验证码,实际上你是在帮Google义务做数据库分类。

甚至已经证明了:全人类每天要花费 500 年在图片验证码上(帮AI做数据分类)。

在线下,Google已经将训练好的AI应用于自动驾驶和博物馆文物上残缺文字识别等领域。所以下次,当你看到验证成功的提示后,就说明,你又为AI贡献了“绵薄之力”。

猜你喜欢

转载自blog.csdn.net/m0_60483056/article/details/122735020