Facebook的语音助手Aloha疑曝光

Facebook的语音助手Aloha疑曝光

文章来源:ATYUN AI平台 

Facebook语音计算革命的速度有点慢。它没有语音助手,它的智能扬声器仍在开发中,而像Instagram这样的一些应用程序并没有完全配备音频通信。但根据在Facebook代码中发现的实验,再加上新的专利申请,情况可能有所改变。

据报道,它即将推出的Portal智能音箱专为与家庭远程视频聊天而设计,包括老年人和可能遇到手机问题的孩子。改进的转录和语音到文本到语音转换功能可以将Messenger用户连接到输入媒体上,并将它们保留在聊天应用程序上,而不是偏向于短信。

鉴于Facebook已经迟了一步,它需要通过强大的实用程序来解决实际问题。以下是Facebook在语音领域的最新发展,以及它过去的实验如何为其下一次重大推动奠定基础。

Aloha

Facebook正在以Aloha为名开发自己的语音识别功能,用于Facebook和Messenger应用程序,以及外部硬件,可能是它正在开发的视频聊天智能扬声器。在Facebook和Messenger的Android应用中,移动研究人员Jane Manchun Wong第一次看到了Aloha用户界面的原型。

精彩视频点击原文:Facebook的语音助手Aloha疑曝光

Aloha语音测试中,当用户在消息线程中说话时,水平蓝条会扩展和收缩,以便在识别和转录到文本时可视化语音量。该代码将该功能描述为与外部Wi-Fi或蓝牙设备建立连接。该软件可能会在Facebook的硬件和软件上运行,类似于在手机和Google Home扬声器上运行的谷歌智能助理。

多年前,Facebook有兴趣开发自己的语音识别软件,专门用于准确转录朋友之间的互动方式。与我们正式处理亚马逊Alexa或Google Home等计算机助理的方式相比,这些语音模式通常更随意,口语化,快速且充满俚语。

Wong还在Facebook的代码中发现了Aloha徽标,其中包含火山图像。有人在Facebook员工的手机上看到了一个Facebook Aloha Setup聊天机器人,上面有类似的标志。

Facebook的语音助手Aloha疑曝光

如果Facebook可以解决这个问题,它可以在Messenger和网站的其他地方提供自己的转录功能,这样用户就可以跨媒体进行通信。它可能会让你无法查看屏幕时向朋友发出评论或消息。然后,接收者可以阅读文本而不必像语音消息那样收听它。该功能还可用于为Facebook应用程序的语音导航提供动力,以实现更好的免提使用。

智能音箱Portal

Facebook的视频聊天智能音箱最初代号为Aloha,但后来更名为Portal,Business Insider的Alex Heath和现在Cheddar于2017年8月首次报道。由于担心会加剧剑桥分析公司引发的隐私丑闻,它被推迟了。

Facebook的语音助手Aloha疑曝光

一项新的专利申请显示,Facebook正在考虑建立一个智能音箱,早在2016年12月26日,它就为立方体形状的设备申请了专利。该专利描绘了由Baback Elmieh,Alexandre Jais和John Proksch-Whaley 发明的“音箱的装饰设计”。Facebook于当年9月收购了Elmieh的创业公司Nascent Objects,现在他是Facebook秘密的Building 8硬件实验室的技术项目负责人。

通往Voicebook的漫长道路

Facebook长期在语音领域进行修整。2015年,它收购了自然语言处理初创公司Wit.ai,该公司运行了一个用于构建语音界面的开发者平台,但后来将Wit.ai推入Messenger的平台团队,专注于聊天机器人。Facebook也开始测试在2015年自动将Messenger语音片段转录成文本,这可能是上面看到的Aloha的基础功能。

第二年,Facebook负责人David Marcus声称“这不是我们现在正在积极开展工作的事情”,但他补充道,“在某种程度上,很明显,随着我们在Messenger中开发越来越多的功能和交互,我们将开始处理语音交换和接口。”然而,一位消息人士称Facebook的秘密语言技术小组已经在探索语音机会。Facebook也开始为想要播放声音而不是视频的用户测试其实时音频功能。

到2017年,Facebook为Pages的视频提供自动字幕,并正在开发语音搜索功能。今年,Facebook开始尝试将语音片段作为状态更新和故事,这些用户可能难以用母语打字。但高管们并未谈及语音举措。

最详细的评论来自Facebook的设计负责人Luke Woods,他在TechCrunch Disrupt 2017描述了语音搜索,说它“非常有前途”。

目前还不清楚Facebook的Aloha究竟会怎样。对于Facebook的智能扬声器和应用程序,它可以是操作系统或语音界面和转录功能。它也可能会像M一样成为一个更加成熟的语音助手。或许它可能成为Facebook与其他语音生态系统的桥梁。

更多语音识别数据集点击“这里”下载

本文转自ATYUN人工智能媒体平台,原文链接:Facebook的语音助手Aloha疑曝光

更多推荐

英特尔收购可编程芯片设计商Omnitek,增强可视化处理和AI推理功能

波士顿动力机器狗大军来袭!十只机器狗拉动卡车,即将投入商用

CapeAnalytics:使用人工智能和地理空间图像向保险公司、再保险公司提供与野火相关的信息

Facebook AI可将音频中的人声在歌手间进行转换

欢迎关注ATYUN官方公众号,商务合作及内容投稿请联系邮箱:bd@atyun.com
欢迎关注ATYUN官方公众号,商务合作及内容投稿请联系邮箱:[email protected]

猜你喜欢

转载自blog.csdn.net/whale52hertz/article/details/91809397