亚马逊Alexa新算法:无需重新训练模型,让AI轻松善解人意

  智东西5月5日消息,据外媒报道,Alexa最近获得了亚马逊所谓的“隐式调用”(name-free skill interaction)功能,这使得它能够解析未明确指出的第三方语音应用的请求意图。例如,向Alexa发出指令:“Alexa,给我一辆车”,你不必指定网约车服务的提供商,它可能就会打开Uber、Lyft或其他一些乘车服务。

  但正如Alexa AI研究部门的科学家所说,这并不像看上去那么简单,因为每次将新技能添加到Alexa技能商店时,理想情况下需要从头开始重新训练将话语映射成技能(被称为“SHORTLISTER”)的人工智能系统,这需要重新训练所有的原始训练数据,以及与任何新技能相关的数据。而Alexa仅在过去一年就增加了数万项新技能,如果神经网络要定期更新,这种做法将非常耗时且不切实际。

  幸运的是,在今年新奥尔良举办的国际计算语言学协会(ACL,The Association for Computational Linguistics)北美分会上,Alexa的研究团队发表的一篇新论文(《Continuous Learning for Large-scale Personalized Domain Classification》)中,研究人员提出了一种省力的替代方案CoNDA(连续神经预适应,Continuous Neural Domain Adaptation)技术。它需要“冻结”AI模型的设置,并添加适应新技能的新网络节点,然后仅在与新技能相关的数据上训练这些被添加的节点。

  研究人员报告说,在涉及900项技能的训练数据集和100项新技能的再训练数据集的实验中,表现最佳的SHORTLISTER版本(总共六个版本)在现有技能上达到88%的准确率,仅比从头开始重新训练的模型的准确率低3.6%。

  一、让AI理解人类的隐含意思有多难?重头训练模型太麻烦

  有时候,人们说一句话不会说全,这个时候听者怎么执行就要靠悟性。

  人们常说会看眼色行事是高情商的表现,那么机器可以说是低情商的典型,往往只能呆板的执行明确的指令,“猜”不出人们话语中的引申义。

  要让机器猜透你的所思所想,那可是相当不容易的一件事,它需要建立一个将人的口头语映射到智能个人数字助理中(IPDA)的自然语言理解(NLU)领域任务的神经网络,这个过程叫做域分类(Domain classification)。这是主流IPDA行业的主要组成部分。

  域是智能个人数字助理中对天气、日历或音乐等特定的应用或功能的定义。例如,用户对Alexa说“我要用优步搭车”,相应的域就会调用“Uber”应用程序。除官方域名外,外部开发人员还会创建数千个第三方域名来提升IPDA的能力。

  每当让AI掌握一个新的“引申义”(即增加一个新域),就意味着需要更新这个网络。

  传统上IPDA只支持数十个分离良好的域名,为了增加域名覆盖范围并扩展IPDA的功能,主流IPDA发布了允许第三方开发人员构建新域的工具。Amazons Alexa Skills Kit,Googles Actions和Microsofts Cortana Skills Kit就是这样的例子工具。而且,为了应对新域的涌入,已经提出了像SHORTLISTER这样的大规模域分类方法,并取得了良好的效果。  郑州不孕不育医院排名:http://m.120ask.com/zhenshi/zzbyby/

  随着越来越多的新域名迅速发展,大规模域名分类的主要挑战之一是在不会失去已知预测能力的情况下如何快速适应新域,一个直截了当的解决方案是,从头开始训练网络,重新训练所有的原始训练数据,以及所有和新技能相关的数据。

猜你喜欢

转载自blog.csdn.net/qq_39443136/article/details/89881600