AI如何挑战传统翻译

来源:mush博客

在过去的十年中,翻译服务呈指数增长,包括Travis Translator等硬件设备    Waverly Labs的飞行员, 微软翻译等耳机  – 不仅翻译文本,还翻译语音,图像和街道标志 – Google翻译,和Facebook翻译。由于机器翻译,翻译速度更快,准确度更高。 

但这对传统翻译来说意味着什么呢?作为德国的外籍人士,我是翻译服务和翻译软件的用户,因此我有兴趣了解更多信息。我采访了Gengo的首席执行官兼创始人Matt Romaine。他于2009年共同创立了Gengo,旨在实现全球语言爱好者获得机会的民主化,并成为大众全球交流的桥梁。Gengo现在提供众包翻译人员,拥有超过20,000名翻译人员,支持35种语言。他们的客户包括Trip Advisor,Etsy,Salesforce,eBay,Facebook和Google。

机器学习为翻译服务带来新机遇 

机器学习的进步并没有消除对翻译人员的需求,而是创造了一种新的经济,并响应了对丰富的多语言数据来培训人工智能系统的迫切需求。今年早些时候,该公司推出了  Gengo.ai,这是一个按需平台,为机器学习系统的开发人员提供Gengo翻译提供的各种多语言服务。可用的服务包括情绪分析,内容审核或任何类型的内容评估服务,例如实体提取,搜索引擎培训和聊天机器人培训。

正如马特解释的那样,“我们开始注意到人们可以通过其他方式使用我们的多系统众包服务。例如,客户要求让我们的翻译人员评估他们所产生的录音的发音和发音。当我们进一步挖掘时,客户正在开发一种机器学习系统,要么能够响应像Siri或Google home这样的口头命令,要么开发一种能够以更易理解的语调说话的系统。

AI就像一个小孩。孩子受教育的类型对结果有很大影响。培训数据对于提高AI和机器学习系统的质量非常重要。我们拥有庞大的人才群和一个全新的商业机会,类似于亚马逊的机械土耳其人,你可以让大批人做简单的任务,但实际上有一系列需要各种专业知识的人,包括语言背景,你需要理解用不同语言表达短语的情绪。这就是我们如何定位自己现在可以使用最初接受过翻译培训并可以申请机器学习和数据应用的人群。“

需要深入分析

Gengo.ai正在开展一系列项目,展示对结构化,高质量数据的需求,使AI系统能够处理需要文化和种族专业知识的更广泛的任务。Matt分享了录制语音数据的例子,以帮助AI更好地了解移民(对于顶级汽车制造商),为2020年东京奥运会做准备。

“基本上,有一个汽车导航系统制造商,他们已经决定建立一个能够理解非本地日语演讲的系统。所以他们需要的是日语录制的小时和小时,但是通过轻微的语调说出来。所以我们是我们已经拥有这一人口统计数据的唯一平台之一。我们能够收集这些数据并扩展日语语言致谢,以便他们与非母语人士合作。“ Gengo能够创建一个音频数据集,其中包含数百个非母语日语用户的录音。

该公司还参与各种活动,如从不同种族(从转换器池)采购眼球运动,以帮助研究自闭症和收集母语人士的手写日文字样样本,以培训OCR引擎阅读手写文件

人工智能是如何推进的?

我很好奇马特对人工智能的进展的看法,解释了一篇有趣的文章,我读到了关于人类对  人工智能进行原型设计的详细说明,其中详细记录了人类做工作的文件,这些工作由人工智能提供。马特指出:

“我们并不是每个人的想象都认为我们会想到的。我们正在做的工作类型已逐渐变得非常具体。我们不仅仅是识别图像或语言,而是在确定特定平台内的语调和情感分析。有趣的是,如果我把它与翻译空间联系起来,媒体上的人经常会谈论机器翻译如何让所有翻译人员失业。但我们实际上更有可能看到更少的人,但是那些受雇的人更多复杂的工作。 

我很想知道Matt对翻译设备的看法。他指出:

“我认为他们太棒了。我的意思是他们打破了语言障碍,他们使沟通变得更加流畅,并在大多数情况下改善了人类的互动。语言就像一个活生生的有机体一样生活。所以总会有新的这些词语和不同代。这里有新的术语。所以他们总是需要知道那些设备是否需要人工输入,并且经过培训才能进行他们的翻译工作。因此,需要更少的人来开发像这样的设备,但总会有人可能是一个年轻的人群,可以解释你的术语或新机器能够将其转化为使用的新词。“

自Gengo.ai推出  以来,该公司迄今已处理了超过10亿字。该公司为AI开发人员提供了一系列免费资源,例如  50个最佳的机器学习免费数据集。AI开发人员可以通过将预先存在的文件发送给Gengo的个人客户经理进行审核来订购AI培训数据,也可以使用Gengo.ai API访问大量数据。

猜你喜欢

转载自blog.csdn.net/weixin_38726452/article/details/87914947