Neurosurgeon: Collaborative Intelligence Between the Cloud and Mobile Edge

郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布!

ASPLOS ’17, April 08-12, 2017, Xi’an, China

Abstract

  如今的智能个人助理,如苹果Siri、谷歌Now和微软Cortana,都是在云端进行计算的。这种仅限云计算的方法需要通过无线网络将大量数据发送到云计算,并给数据中心产生了巨大的计算压力。然而,随着移动设备中的计算资源变得更加强大和高效,出现了这样的问题:这种只使用云计算的处理是否值得推进,以及将部分或全部计算推到边缘的移动设备上意味着什么。

  在本文中,我们研究了纯云处理的现状,并研究了能够有效利用云中和移动设备上的周期来实现这类智能应用的低延迟、低能耗和高数据中心吞吐量的计算分区策略。我们的研究使用了8个智能应用程序,跨越计算机视觉、语音和自然语言领域,所有这些应用程序都采用最先进的深度神经网络(DNNs)作为核心机器学习技术。我们发现,鉴于DNN算法的特点,一种基于DNN中每一层的数据和计算变化的细粒度层级计算划分策略比现有方法具有显著的延迟和能量优势。

  利用这一观点,我们设计了一个轻量级调度器Neurosurgeon,它可以在移动设备和数据中心之间以神经网络层的粒度自动划分DNN计算。神经外科医生不需要每个应用程序的配置文件。它适用于各种DNN架构、硬件平台、无线网络和服务器负载级别,智能地划分计算以获得最佳延迟或最佳移动能量。我们在一个最先进的移动开发平台上对神经外科医生进行了评估,结果表明,神经外科医生的端到端延迟平均提高3.1倍,最高可达40.7倍,移动能耗平均降低59.5%,最高可达94.7%,数据中心吞吐量平均提高1.5倍,最高可达6.7倍。

猜你喜欢

转载自www.cnblogs.com/lucifer1997/p/12006027.html