阿里 90 后科学家研发,达摩院开源新一代 AI 算法模型

640?wx_fmt=gif

640?wx_fmt=png


整理 | 一一

出品 | AI科技大本营(ID:rgznai100)

7月5日,阿里达摩院宣布开源新一代人机对话模型ESIM。该算法模型提出两年多,已被200多篇论文引用,更曾在国际顶级对话系统评测大赛(DSTC7)上获得双料冠军,将人机对话准确率的纪录提升至94.1%。

ESIM模型还被用来评测一些新提出的数据集,比如来自纽约大学的MultiNLI数据集、最近大热的来自华盛顿大学的SWAG数据集、NAACL19 Best Resource Paper常识知识QA数据集CommonsenseQA等等。

据介绍,比起业界使用最为广泛的LSTM模型,ESIM人机对话回复模型回复准确率更高。采用全新ESIM模型的人机对话回复模型,比LSTM模型回复准确率提升25%(数据来自ICASSP2019论文中Ubuntu测试集数据)。

 640?wx_fmt=png

陈谦参加第七届对话系统技术挑战赛

ESIM模型最初由达摩院语音实验室内的90后科学家陈谦(花名潭清)研发,他博士毕业于中科大,是达摩院中最年轻的科学家之一,也是2018届的阿里星(阿里星是专门针对高校顶尖人才的一个培养计划,从应届毕业生中经过层层筛选,由技术带头人担任主管,进行重点培养,每年的阿里星平均只有20人不到)。

在去年DSTC 7对话系统评测大赛上,ESIM在NOESIS赛道中从麻省理工学院、约翰霍普金斯大学、IBM研究院等近20支参赛队伍中拿下该赛道两项比赛的冠军。NOESIS赛道考察AI的人机对话能力,要求AI根据给定的多轮人机对话历史,从成百到上万个句子中选出正确的回复。

640?wx_fmt=png

ESIM模型的原理论文已于2017年发表在国际顶级自然语言处理会议ACL 2017,阿里巴巴此次开源的模型原理论文发表在了今年国际顶级语音会议ICASSP 2019上,在公开的标准数据集Ubuntu(英文)和E-commerce(中文)上均取得了目前最高的成绩。

人机对话系统及其背后的认知智能,为让机器快速准确理解人类的表达,ESIM给AI装上一套“雷达”系统,赋予它实时检索对话历史、自动去除干扰信息的能力,使它能够给出人类期待的回复。

目前,这一模型已在基于ESIM模型研发的智能语音点餐机、地铁语音售票机等应用中落地,还可能将给智能客服、导航软件、智能音箱等应用场景带去改变。

开源地址

https://github.com/alibaba/esim-response-selection

论文链接

https://arxiv.org/pdf/1901.02609.pdf

【END】

640?wx_fmt=jpeg

 热 文 推 荐 

阿里云技术战略总监陈绪:45 岁开源老兵“中年花开”阿里云 | 人物志

“遗留代码是传奇!”

不写一行代码就能玩转 Kaggle 竞赛?

为什么说苹果是唯一在乎你隐私的科技公司?

☞中国有微信和支付宝, 你为啥还费力不讨好去做区块链? | 人物志

☞数据库风云:老骥伏枥,新秀辈出

☞智能文本信息抽取算法的进阶与应用

☞正态分布为何如此重要?

☞泪目!Linux之父:我就是觉得苹果太没意思!

640?wx_fmt=gif点击阅读原文,输入关键词,即可搜索您想要的 CSDN 文章。

640?wx_fmt=png 你点的每个“在看”,我都认真当成了喜欢

猜你喜欢

转载自blog.csdn.net/csdnnews/article/details/94930733