机器如何学习?一个老师机器人负责数千名学生,测试100万道题

全文共3323字,预计学习时长9分钟

图源:unsplash

我们总能听到机器学习、深度学习、神经网络这样的词,但是你是否清楚这里的“学习”到底意味着什么?它只是销售软件和服务的营销词汇吗?还是说科学家真的创造了类似人脑的组件并令其在机器内部运行呢?机器会占领世界吗?

别担心,还没到那个时候。本文就将为你祛魅机器学习,科学家是如何教计算机完成人类的任务,甚至在某些情况下比人类做得还好。笔者将用最直白的话给大家解释这个问题,努力让任何领域的人都可以理解。

为什么需要学习?

在学习开始之前,解决问题离不开算法的编写。算法只是一组规则,往里面输入后得到的输出即可作为问题的解决方案。

请考虑以下情况:有一个数字列表,要求你按升序排序,有很多算法可以解决此任务。这些算法通过获取列表,执行一些规则和操作,然后返给你排好序的列表。对于计算机科学家来说,这种问题“很容易”解决。他们只需要思考并提出一种算法来解决任务。

但同时,有些问题不是那么容易用算法解决。人们开始对计算机有了更多的要求,他们希望机器具有解决艰巨任务的超能力,是那种连科学家都完全不知道如何编程的任务。

例如:如何编写一种算法,以获取动物的图像并输出其类型?对于人类而言,这是一项非常容易的任务,但对于算法来讲就是一件很复杂的事儿了。人类知道如何对动物照片进行分类,但是他们不知道如何描述他们为获得答案所采取的步骤。因此,出现了一个重要的问题——如何解决连人类都不知道如何描述的问题?

算法的世界!

互联网中,算法无处不在。你正在阅读本文,是因为有一种算法把这篇文章呈现在了你眼前,可能是因为你点击了什么,然后算法会记录你打开的链接。该算法决定了你搜索查找照片所看到的内容,甚至可以为你制作一个小电影。

股市充满了算法,交易需要进行。当你购买东西时,该算法确定价格,并且在你的账户监视交易是否遭到欺诈。

这些小小的算法塑造了你的世界。当它们在过去的人造算法机器人中工作时,人类可以提供“如果这样,那么该那样”形式的解释说明。但许多问题太大而又难以简单阐明,例如在一秒钟的十亿次金融交易中发现欺诈性交易,算法能想办法发挥作用。

图源:unsplash

设想,一个航空公司如何设定飞机座位的最高价?用户现在要支付的价格由算法机器人确定。虽机器也并不完美,但比人类能做到的要好得多!没有人知道,甚至建造它们或将来将要建造它们的人都不知道他们是如何做到的。

人工算法的失败

图片中是什么?是蜜蜂,还是3?对于人类来说,即使是小孩子也很容易说出答案,但用一种机器人语言(一种逻辑门语言)告诉机器人就不太可能实现了。

不是3

不是蜜蜂

我们只知道那是蜜蜂和3,我们可以用言语来区分它们,但是机器人无法理解言语,而正是大脑中的联系才使我们分清二者。

虽然我们大脑中的单个神经元可以很容易被理解,但是组成大脑的神经元簇却很难被理解。虽然我们无法理解这个整体,但是它起着潜移默化的作用。所以,要想让一个机器人在蜜蜂和数字3之间进行分类,你不需要直接建造这样的机器人,只需要建造一个建造机器人的机器人和一个教授机器人的机器人。这些机器人的大脑十分简单,一个优秀程序员可以轻而易举做出来。

记住,建造机器人是用来建造的,但教师机器人并不用于教学,只用于测试学生机器人。

训练有素的教师机器人

实际上,学生机器人并不擅长测试。起初,建造机器人在任意机器人的大脑中进行随机连接,于是教师机器人接收到了一些非常特殊的学生机器人,教师机器人需要教他们如何区分蜜蜂和数字3。人类首先需要给机器人老师一堆蜜蜂和数字3的照片,并告诉他们这是什么。

学生机器人参加了测试,但他们做得不好。这不是他们的错,他们被建造时就是这样的。他们被重新带回建造机器人那边,那些做得好的会被放在一边,其他的则会被回收利用。

建造机器人仍然不擅长建造机器人,但现在它将那些做得好的机器人留下来,并用新组合的变化进行复制,然后送回学校。新的学生机器人到了之后,老师机器人一次又一次地测试它们,建造机器人一次又一次地建造,平均测试分数一次又一次地提高,先是60%,最后直到99.99%的完美。

以前,人类可以为他们的机器和机器人编写算法,但现在,我们做到了让机器通过任务模式进而创建自己的算法

所以一个测试和试错的方法已经完成了,这并不是针对一个或两个机器人,而是针对十亿个不同的机器人,有不同的随机连接,而且测试题又有十亿页长。如前所述,这是针对那些bot语言中存在的问题,那些我们无法告诉机器人的问题。

人类无法训练的机器人

老师机器人并不是在监管一个有十几个学生的老校舍,而是一个有几千名学生的无限仓库,考试不是10道题,而是100万道题,他们究竟考了多少次?

无限校舍

建造机器人会不断重复构建过程(随机连接)。起初,留下来的学生只是幸运而已。但是,通过组合足够多的幸运机器人,只保留那些有用的,然后随机地组合出新的副本,最终一个学生机器人出现了,它不是靠运气,而且可能几乎不能区分蜜蜂和数字3。这一点被复制,并被应用到所有其他机器人。

慢慢地,平均测试分数上升,下一轮生存所需的分数也越来越高——从50%到60%,70%,80%,90%,95%,等等。

当我们继续这个循环,最终,从无限大的校舍里,一个可以分辨出照片中的一只蜜蜂和数字3的学生机器人会出现,准确率高达99.999%。这个数字意味着在假设的1000000张照片集合中,只有1张照片出错!

但是学生机器人是如何做到这一点的,无论是教师机器人,建造机器人,甚至是人类的监督者都无法理解,学生机器人本身也是如此。在保留了这么多有用的随机变化之后,它的线路和芯片就变得极其复杂。虽然一行代码不难理解,可代码簇就难了。就是因为这样,机器人的代码整体很难被我们理解。

这是可的,但也同时令人沮丧,特别是学生机器人只擅长已经被教过的问题。如果照片是倒置的,或者照片不是蜜蜂,比如猫,它就会觉得很困惑。我们的机器人老师不能教所有的东西,所有的人类监工能做的是给它更多的问题,使测试更长,连最好的机器人会出的错也要训练到。

理解这一点很重要,这也是公司非常喜欢收集数据的一个原因——更多的数据等于更多的测试,等于更好的机器人。当你在网站上做“你是人类吗”的测试时,你不仅证明了你是人类,而且也在帮助建立这个测试,让机器人能够读、数、分辨山峦上的交通灯、马和人。

在互联网上的任何地方,后台都有一些测试来增加用户的互动,或者设定合适的价格来使得收益最大化,或者从你所有的朋友那里“偷钱”。你喜欢朋友分享的文章,这是让机器人根据你的联系人了解你喜欢什么的一种方式。如果它是可测试的,那么它就是可被教的!

至少在一段时间内,教师和学生机器人将从数据备选库中毕业,正式成为领域中的算法。我们习惯了这样的想法:我们使用的工具,即使自己不懂但总有人懂,但随着机器学习发展,我们越来越处在一个人类使用工具或被工具使用的位置,没有人、甚至它们的创造者也不懂。我们只能希望可以用测试来指导工具,并且用起来顺手。

识别蜜蜂和3只是一个简单的例子。现实世界的一些应用包括:早期发现癌症,我们训练机器人理解各种癌症发展和分类模式,辨别恶性癌症(严重、紧急医疗)或良性(稍不严重、最小的医疗保健);解决航空公司座位价格;提前数月预测危险的龙卷风;还有自动除颤器的应用等等。

自动除颤器

虽然对人类来说一些算法已成黑箱,但也不用担心机器人会占领世界。正如机器学习专家Andrew Ng所说:“担心机器人接管世界就像担心火星上的人口过剩一样。我们还没到那时候呢!”

一起分享AI学习与发展的干货

欢迎关注全平台AI垂类自媒体 “读芯术”

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)

猜你喜欢

转载自blog.csdn.net/duxinshuxiaobian/article/details/108626132