专访思必驰初敏:离开微软、放弃阿里,一个语音交互的“实用主义者”

640?wx_fmt=jpeg

栏目简介:激荡六十年,人工智能已经起航。然而在未来面前,我们都还是孩子。究竟是“奇点临近”?还是泡沫行将破灭?为了解惑,《AI名人堂》将汇聚领航者智慧,和你一起探索前行的方向。

 

记者 | 杨丽

出品 | AI科技大本营

 

提起微软,初敏至今都觉得是人生学术生涯中最辉煌的时刻,没有之一,在那里她工作了近十年。“如果选择做研究,那么微软研究院仍然是我认为最好的地方。”再谈阿里,那离得很近的温热感似乎还在掌心,挥之不去。去年上半年,初敏仍是以阿里 iDST 语音负责人的身份出席活动。后来,她曾无意中提起“阿里先验证商业模式再逐步跟上技术的路子”令她获益匪浅,当AI科技大本营记者再问起初敏博士,这是否成为了她接下来工作的烙印时,她毫不犹豫地回答说:“是的。”

 

其实,初敏最早是中科院声学所的研究员,后来还在英特尔有过短暂的研究经历。相比起来,每一次的抉择无不透露出她内心一直所遵从着的态度,“我希望有真正的商业价值,而不是仅仅获得了些 paper 和专利。所以,我觉得商业化是必须的,而且我很重视这件事情,换句话说,这也是个人成绩的一种体现。”

 

去年 8 月,初敏在外界一片惊讶声中离开阿里加入思必驰,任北京研发院院长。她用一年时间,迅速将北京研发院团队扩充至 50 人,组建了一支从基础研究到应用落地的研发团队。

 

数天前,在京城瓢泼大雨的那个下午,一场小型的媒体沟通会上,初敏首次对外展示了她在思必驰的第一个作品“会话精灵”,一同亮相的还有思必驰 CMO 龙梦竹以及“会话精灵”产品团队。

 

不同于以往思必驰所专注的智能终端服务,此次由初敏团队推出的“会话精灵”是一款针对企业智慧服务的定制平台,可提供虚拟机器人的在线定制服务,并主打启发式交互技术。

 

那么,这是否意味着思必驰开始由消费级向企业级市场拓展的一次试水?

 

会上,媒体不约而同将目光聚焦到了“会话精灵”的产品形态、应用场景、商业模式、合作方式等方面,毕竟,一款仍处于孕育期的 Beta 版产品会存在诸多可能性,“坦率来讲,我今天还不能对目标行业给出清晰定义,因为当前阶段的主要精力不在这里。”面对这些疑问,初敏还是给出了自己的答案。

 

 

转折:源于交互式对话

 

 

不少人将 2017 年称为智能音箱的元年。确实,这场由巨头掀起的智能音箱补贴浪潮,到去年双十一之后的季度出货量基本维持在 100 万台,粗略估计下,2018 年中国智能音箱市场规模有望达到几百万甚至上千万台。

 

但从实际应用效果来看,智能音箱却未能形成消费者的强需求。目前,智能音箱能提供的服务内容仅限于音乐、天气查询、设置闹钟等简单操作,跟故事机没有本质差别,而且同类产品除了设计外观、功能稍许不同外,基本上同质化非常严重。

 

采访中,初敏表示,智能音箱的负载能力是有很大空间的,未来智能音箱的应用将更加垂直,这意味着一定要有更为细化的内容配合和良好的交互体验。

 

所以回到思必驰身上,尽管目前在智能终端上的语音交互上拥有不错的优势地位,但在具体的用户体验上,包括整个行业在内,仍未到一个特别“爽”的状态,“这也是我们选择做启发式对话系统的初衷。”不过,她也略带调侃道:“优势吃老本也就那么几年,如果没有更好的新的优势出来,还是会有风险的。”

 

正因如此,“会话精灵”似乎也是水到渠成,如官网介绍的那样,“它带来的是一种全新的信息交互方式。”

 

“常见的人机对话技术如任务型对话、基于问答对的对话、基于知识图谱的对话、生成式对话等都是一种被动式对话,而会话精灵则增加了复杂知识结构的管理和启发式引导技术,以加强人机交互的效率。”思必驰产品经理刘博解释道。

 

首先,企业需要通过话题目录树来管理知识和话题,以进行知识定制。如话题树,对知识所属的话题进行规划;知识卡片,将具有结构化特点的知识填入知识卡片中,当用户提问到卡片中的问题时,后台会自动提取答案并组织回答;知识问答,则是通过添加问答的方式录入用户有可能问到的知识点。

 

而启发式引导则是一种基于机器人主动应答的过程。如在微信端,通过企业公众号,机器在试图根据用户的提问给出相关解答后,还会从相关的话题中选择 1~3 个推荐问题,逐渐引导用户实现企业知识传播或商业目标的实现。

 

当然,除了微信公众号,会话精灵未来还可以在企业 App、交互式官网、智能终端上得到应用。在知识传播场景下,可以作为教学助手、企业信息管理助手、微信公众号助理等进行服务,而在目标引导场景下,最常见的是销售助手、客服助手等。

 

 

质疑:这是不是就是客服?

 

 

“教学助手”、“销售助手”、“客服助手”……这乍一听让外界难免会认为,“会话精灵”其实就是在做企业服务领域的云客服系统。实际上,早在 2014 年前后,这个领域就涌现出了大批创业公司,“在线客服”、“智能客服机器人”、“工单系统”均是该时期的新名词,发展到当前阶段,如环信、小能、容联七陌、快商通等几家厂商的模式与口碑已逐渐被客户认同。

 

初敏承认,在推出初期,就连公司内部也并不是所有人都理解会话精灵究竟在干什么,甚至大家更愿意理解成:“是不是就是智能客服啊?”

 

但她同样指出,思必驰选择切入企业端,并非跟市面上常见的客服系统是一样的,“我们对这个事情是做了很多思考和探讨,并不是拍了脑袋就决定做的。”

 

一直到今年年底之前,将“会话精灵”免费开放给用户体验,以衡量这款语音助手是否能真得为企业带来价值,甚至可能愿意付费。

 

在某些垂直场景里,在初敏看来,思必驰不会做很复杂的完整的解决方案,比如跟 CRM、呼叫中心连接的工作,“我们会跟行业里的垂直方案商沟通,将自己的能力集成在其方案中,让(方案商)的用户体验得到更好的人工智能能力。而思必驰定位是专注在语音交互的层面,这就决定了其不会在某一个行业深耕。”不过目前团队需要在知识图谱的搭建上做大量工作,如先在后台内置几十个场景,具体内容还需要企业本身来提供。

 

“做产品,我从来不去讲一个很大的故事,但我觉得,最有效的验证就是有没有真正的被很多用起来。所以,在未来的几个月里,我们会帮助公司内部的相关业务团队先用起来,同时也会在几个重点关注的场景中找到合作伙伴,引进外部客户使用起来。”

 

初敏坦言,思必驰目前无论是招揽人才方面,还是做事的过程上,都给了她很大的支持,这也让她可以有一个相对专注的空间做事情。但对她自己来讲仍需要结果为导向,“只不过,今年还处在产品打磨阶段,明年开始才真正大刀阔斧地拓展市场。”

 

可以预想的是,微信端、交互式网页只是“会话精灵”尝试的第一步,接下来在智能音箱等终端硬件上同样也有可能接入“会话精灵”这样的交互方式,这一方面也正是思必驰的原始积累所在。

 

对于这一构想,初敏觉得如果做企业级语音交互,有屏无屏的差别还是很大的,而有屏的效率会更高。“未来,有屏的可能性会越来越高,只不过不一定是音箱上装个屏,可能是跟投影仪、电视连接一下。从行业趋势看,大家都在想怎么获取屏,纯语音交互是有问题的,多模态交互成为必然。”

 

但她同样指出,如果不需要屏,那么就得思考如何在语音交互过程中调整,反过来对交互的能力要求会更高。

 

 

确信:语音交互的“后阿里时代”

 

 

2008 年,阿里因王坚博士的加入,让初敏开始注意到这家公司。那时,阿里还是一家以 B2B 电子商务为主营业务的公司,第一行“飞天”代码也未写下。

 

直到 2017 年,阿里云计算已经拿下中国公有云市场的半壁江山,此时的初敏则已是阿里 iDST智能语音交互方向的负责人,相继为支付宝、手机淘宝、钉钉等产品嵌入了语音交互能力。

 

但这远远不够,在此前媒体采访中,初敏谈到了选择加入思必驰的初衷,“思必驰是比较坚定的做语音交互的公司,他们真的认为语音交互很重要,目标就是要做好交互技术,再以平台的形式对外开放,让本身不是这个领域的公司也具备语音交互能力。”或许正是在思必驰,让初敏终于有了更多时间聚焦在语音交互的商业化探索上。

 

在谈及思必驰作为阿里天猫精灵背后的语音交互解决方案提供商,是否会与之在企业级市场产生竞争关系时,初敏表示,绝大多数时候应该不存在这样的问题,因为双方的市场、客户、规模可能都不一样。以钉钉为例,它做的是一个平台,智能客服并不作为自己的主要业务,所以无论是选择第三方还是自家的产品都不重要。“关键是,我们做的东西好不好,做的东西是不是真正有用户,能不能让用户体验到你设想到的那些好处。每个行业都有巨头,并不是有了巨头,别人就没有生存的空间。”

 

2017 年 9 月,在宣布初敏加入的同时,思必驰还发布了 DUI开放平台。作为一个全链路定制化开放式语音对话平台,开发者可从唤醒词、语音识别、语义理解到对话管理、输出以及 TTS 实行定制。基于这个平台向上,与思必驰的智能终端服务和企业智慧服务形成闭环。也就是说现阶段的“会话精灵”,只需要做好对接以最大化利用底层 DUI 赋予的语音交互能力。

 

“会话精灵是我到思必驰之后探索的一个新的业务方向。此外,我还会在自然语言理解、语音合成等方面进行深度学习上的探索。”采访中,初敏笑声爽朗,这从来都是她的选择,不为任何人所折服。

 

——【完】——

在线公开课 知识图谱专场

精彩继续

时间:8月9日 20:00-21:00

添加微信csdnai,备注:公开课,加入课程交流群

参加公开课,向讲师提问,即有机会获得定制T恤或者技术书籍

640?wx_fmt=jpeg

猜你喜欢

转载自blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/81417201