对话微软黄学东:语音语言技术是镶在 AI 皇冠上的明珠

  雷锋网按:上一次你和你的电脑进行有意义的对话,并且感受到它能真正地理解你,是什么时候呢?如果微软技术研究员、微软的语言语音小组组长黄学东博士做到了的话,那么你也将可以做到。并且,如果他以往的研究真的达到了他所说的水平的话,这一天到到来可能要比你想的还要快。

  黄学东教授在播客中谈了谈他作为微软首席语音技术科学家的工作内容,告诉我们一些关于语言语音技术最新的里程碑的内部细节,以及说明掌握语音识别、翻译、交流是如何让机器在从“感知人工智能”到“认知人工智能”转变的路上走得更远,和语音识别、翻译、交流有多接近真正的人类智能。雷锋网全文编译如下。

  主持人:黄学东,欢迎来到微软的播客节目。

  黄学东:谢谢。

  主持人:您是语言语音小组的微软技术研究人员,还领导着微软的口语工作,我们稍后会进行深入探讨。但首先,作为微软的首席语音科学家,先简单告诉一下我们您做了些什么,以及为什么要做这些事情。让您每天起床的动力是什么?

  黄学东:好的,我们现在所做的事是确保我们有最好的语音语言技术能被应用到更广的领域。我们之所以有个团队去做这件事,是因为我觉得这不仅是人类最自然的交流方式,而且这还是我们现在面对的最艰难的人工智能挑战。这就是我们所做的,在我们的云端 Azure Services 上尝试去真正突破,去提供出色的服务,以及确保我们能让微软的客户和微软之外的客户满意。如果你想要框定整个事情,主要有三个方面。

  首先,我们有能力去驱动语音识别的准确性,去驱动合成工作的自然性,当你把英语翻译成汉语、法语,德语的时候,去确保翻译质量是精确的。因此,有很多科学家在背后去确定这些精确性、自然性以及潜在因素,他们是世界一流的科学家。这是第一方面。

  第二方面是,我们不仅提供技术,我们还在Azure上提供服务。从Office 到Windows,Cortana,它们都依赖着同一个云服务。不仅如此,我们还有边缘设备,像我们的语音设备SDK。因此,我们想要确保在边缘设备和在云端上的语音技术都是以现代的方式进行的。这是第二方面:平台是现代化的。

  第三方面是对消费者展现爱意,因为我们在全球拥有广泛的客户。我们想让消费者高兴,想让我们的消费者体验到他们使用的语音翻译是一流的。

  这就是我实际上主要做的三件事:提升AI 的能力,使我们在云端和在边缘设备上的平台现代化,爱我们的顾客。

  主持人:嗯。您有很多团队在这些小组中工作,来解决我们称之为“支柱”的问题。

  黄学东:是的,我们在世界各地都有团队。并且,这些团队的多样性是很惊人的,因为我们在尝试克服语言障碍。因此,我们在中国有团队,在德国、以色列、印度、美国同样也有。我们的工作遍布全球,尝试着去应对这些语言挑战。

  主持人:我想先引用您的话为我们的今天的谈话做准备。您说过,“语音语言技术是镶在 AI 皇冠上的明珠。”为我们说明一下吧。

  黄学东:嗯,好的。我们可以从人类进化的范畴来思考。在某个时期,语言诞生了,它加速了人类进化。如果你想想这个星球上的所有动物,就像你知道的,有很多动物跑的比人类快,视力比人类好······

  主持人:它们的牙齿也很锋利。

  黄学东:尤其是在晚上。

  主持人:它们很强大。  郑州妇科医院http://jbk.39.net/yiyuanzaixian/sysdfkyy/郑州人流医院http://jbk.39.net/yiyuanzaixian/sysdfkyy/

  黄学东:是的。它们听的比人类远,嗅觉比人类灵敏,但是,只有人类拥有语言。我们能够很好的去组织,能够用科幻小说的术语去描述,能够自我组织,能够写出一部宪法。如果你看到人类的这些方面,你就会知道,是语音和语言将我们和其他动物区别开的。对人工智能来说,语音语言技术能够驱动人工智能进化,就像它驱动人类进化那样。这就是为什么它是镶在人工智能的皇冠上的明珠。而且它还是坚硬的那颗,难以破坏。

  主持人:是的。有一个关于这个话题的哲学性讨论,但它引出了一些有趣的问题。如果您在机器语言上取得了很大的成功,那么,这些机器会是什么呢?

  黄学东:让我们发挥一点想象力。在某些时候,我们说计算机能够理解三百种语言,还能够流利地交流和对话。我还没遇到能够说三百种语言的人。而且,机器不仅能够流利地交流和对话,还能够领会、理解、学习、推论以及能够在所有科目上都能拿到博士学位。这种知识的获取、推论超过了任何人的个人能力。当这一刻到来的时候,你可以想象人工智能将会有多聪明。

猜你喜欢

转载自www.cnblogs.com/sushine1/p/10885520.html
AI