这个【民科】眼里幸运飞艇平台出租的AI机器人，才是最真实的！

“民科”，我认为是指那些不以幸运飞艇平台出租QQ2952777280【话仙源码论坛】hxforum.com【木瓜源码论坛】papayabbs.com 某事为职业或没有受过专门训练，却做某事的人。好巧不巧，在AI领域，我就是一个“民科”。

我们都有这种体会：在餐厅点菜，经常会在菜单上看到奇葩的菜名，却不知道是什么食材做的。通常餐厅越别致、越豪华，这种情况越多。为什么要这样？因为可以忽悠你买单呀。而父母给我们做菜的时候通常不会如此，不然我们问父母，今晚吃什么菜，他们说吃“吻别”。当看到菜端上来的时候，会不会有点错乱的感觉？

对厨师这个职业来说，烧菜的父母也是“民科”。

关注科技信息的朋友，一定对目前AI智能机器人的蓬勃发展而欣喜若狂，那些科技大佬、专家嘴里时不时冒出“神经网络”、“深度学习”、“训练”、“算法”等拟人的词语，让我们有种计算机已经可以和人一样思考问题的感觉，幻想着一款类似“her”电影里的机器人不久就会来到我们面前。

真是这样吗？

真相：想象很丰满，现实很骨感！

作为一个有AI方面的发明专利，又有自己的AI机器人，并对那些新名词不怎么感冒的“民科”，有必要剥去现在AI智能机器人华丽的外衣，帮你还原它们的本来面目，毕竟我也同样被迷惑过。

其实，AI机器人并不是新鲜事，我敢说在看这篇文章中99%的人出生前它就已经存在了。它最早是由美国麻省理工的约瑟夫于1966年开发，采用的技术是关键词匹配，而真正进入大众眼帘的可能是十年前的小黄鸡，这是个小的聊天小程序，你可以用它问这问那，感觉它什么都知道。它并不高大上，在很多人眼里，和贪吃蛇这样的小游戏并没有什么区别，虽然火了一阵，并没有引起什么大公司的关注。在安静了几年后，再次火起来是2014年的微软小冰，它一出现，就以一种高姿态进入了千家万户，之后各种AI机器人如雨后春笋般地冒出来，覆盖我们生活中的方方面面，它不仅仅只是为了聊天而存在，还有非常深层次的原因，这在我上一篇《你知道吗？一把能打开10000亿新兴市场的钥匙就攥着你手里！》着重强调过。

现状：99.9%号称智能的AI聊天机器人都是不智能的。

很多AI人工智能公司都宣称自己的机器人具有“完全自主知识产权的自然语言处理引擎和交互分析能力，功能强大，覆盖了NLP中的词法、句法、篇章、语义等各个方面，满足了企业与专业用户人机交互中核心的语义分析和理解的需求。”遗憾的是，99.9%都是不智能的。一些演示的视频看上去神乎奇迹，不过是照本宣科特意做出来的。

如何判断一个聊天机器人是不是真的智能呢？可以通过两个因素进行判断：

1）它能否自我学习，随着时间变得越来越聪明；

2）它能够基本听懂你说的所有话。

而目前世面上的所有的聊天机器人基本都不具备这方面。他们能回复，并不是听懂了，而是基于大数据，然后训练出来的结果，他们根本不理解你说的内容。

穿插一句：训练其实就是机器利用一定的统计方法对大数据进行处理，然后统计出某些规律，方便后面拿来使用的过程。例子可以看我《演讲——“数学之美”读后感》一文中，对“今日天气”百度搜索的大数据分析，就一目了然了。

为什么现在的聊天机器人不智能？

因为自然语言是进化史上最复杂的产物之一，要攻克让机器理解自然语言这个难关，难度非常大。网上炒得如火如荼的阿法狗，和优秀的聊天机器人相比，实现的难度好似制造扳手和精密仪器的区别。世界科技大公司对聊天机器人投入的时间、金钱、人力超过了AlphaGo千百倍都不止，现在AlphaGo在围棋上可以战胜世界上最强大的人类，可最强大的聊天机器人都无法超过一个三岁的小孩，甚至远远不如。让阿法狗获得巨大成功的大数据，为什么在聊天机器人这块却举步维艰呢？

人类语言往往是高度模糊的，有时候我们人类自己都搞不明白是什么意思。

比如：“这个店的东西不好买。”

你告诉我，这个店的东西值得买，还是不值得买？

和人能接受模糊的概念、不太正规的语法不同，聊天机器人采用的是编程语言（一种概念清晰、语法正确，不能有一丝模糊的机器语言），要让这两种语言相互识别，这如同要把水和油融合在一起。上世纪70年代前，人们采用语法规则来教机器人掌握语言，因为我们就是这样教下一代的，结果实现起来遇到了极大的阻碍。之后，人类开始利用大数据统计找规律，而不是利用语法、词义来理解句义的方法，来解决人机交互的难题。

目前采用的方法大致是：

煎——人工模板。就是类似填空题，机器内部先输入大量的填空题，然后用户的语言如果能整句匹配上去，就调用其中填空中的内容，再找到对应的内容去回复或者执行某动作（这需要人工来编写针对不同场景的模板，例如Siri、竹间的小影、微软的小娜、手机助理等。），类似表演中的对台词：你这么说，我那么答。

炒——检索。第一代AI机器人的关键词法在这里大行其道。和人工模板类似，只不过更加简单，都不需要整句的匹配，只是选取当中的关键词。然后再从语料库（就是之前真人交互时的对话内容，这些公司花大力气收集起来的各种人类交互的语言）中，找出对应的回复出来。其中有可能找出百八十句，再采用一些方法（参数、权重什么的），找出最可能适合的回复。

烹——机器翻译。因为以前英文翻译成中文，或者中译英都有很多年的经验了，然后把这个经验拿过来用以解决机器人识别用户语言的过程。

炸——深度学习：就是利用了大数据统计的方法，把用户语言当成冷冰冰的数字来寻找规律，为了能实现回复的准确性，把过程设计得非常复杂，也是目前AI机器人努力的方向。微软小冰就实现了把一句话按字词拆分，然后逐个深度学习后先得出每个字词对应的内容，再根据语法再串成句子回复。类似把糖葫芦拆散，然后找到各自对应的羊肉，再把羊肉串起来的过程。

为求达到最好的效果，目前AI机器人在实际运用时都会结合这4种方法。在特定领域，比如询问天气、查询车票、客服咨询这快，效果还是比较好的，因为目的明确，人类的表述基本是固定下来的，总共也就是百来句，可以用“煎”的方法来解决。现在很多公司对大量重复性的对话工作都用客服机器人来代替，对不上台词的就转入人工。

可这并不智能！像百度的小度机器人、小米的小爱机器人，当个玩具还行，真指望它们能正常交互？还是算了吧。

而能体现智能水平的聊天机器人，首推微软小冰，微软不缺技术、金钱、人力和时间，对大数据的处理和应用都是行业的领先水平。从14年到如今，整整4年过去了，可小冰的聊天水平呢？几乎没有提升，哪怕微软小冰的高管说他们采用了多少高深的技术，可展现出来的结果还是非常的差。记得在我直播演示比较的时候，小冰被我的聊天机器人吊打，在近十个内容中，小冰只有一个回答勉强能算对，其他都回答错误。目前聊天机器人的回复普遍具有：缺乏“一致性、逻辑性、记忆力”几大弊端，很多时候连回复的准确性都实现不了，这极大地制约了聊天机器人的发展。

还有一类聊天机器人是竹间智能科技的小影，号称要创造出比微软小冰更有情感的聊天机器人，他们采用了人工模板的方法来解决聊天机器人的问题。似乎把上面的几大弊端掩盖起来了，可因为语言表达是无穷的，造成人工模板的设计速度远远跟不上语言表达的内容。在我直播演示的时候，这类聊天机器人暴露出的问题也非常明显，这也是为什么微软小冰没有采用这种方法的原因。

结论：基于大数据的方法已走到末路，《数学之美》中的数学此时已经不美了！

看到这里，大家可能对目前聊天机器人有点小小的失望吧。难道聊天机器人就只能当一个无聊解闷的工具？成为各种APP的接入口只是美梦一场？绝对不是这样！敬请关注我下一篇《人工智能的未来，不在于……》。

这个【民科】眼里幸运飞艇平台出租的AI机器人，才是最真实的！

猜你喜欢