机器学习+运筹优化=?


演讲嘉宾简介:谭剑,阿里巴巴达摩院MIT资深算法专家。


数十款阿里云产品限时折扣中,赶紧点击这里,领劵开始云上实践吧!


本次直播视频精彩回顾,戳这里! 

 

简介

本次分享主要围绕机器学习和运筹优化两个方面。它们在学术角度存在很大的重合,也有各自的侧重点。为了更好地帮助大家理解,这里借用心理学教授DANIEL KAHNEMAN的表达。


e4b4eed06f9cd340c83b21913d4194612806a8ed


人有两个系统,System1System2,分别负责快思考和慢思考。所谓快思考,即普通人在12秒之内能做出的决定,反之,如果需要一定的专注和专业,则为慢思考。在过去的六七年中,业界逐渐取得了在机器学习技术上的突破。而在很多传统行业中,关注的更多的是运筹学的内容。在复杂的生产管理和商业运营中,往往需要人在System1System2之间进行反复的迭代,以取得更优的解。下面将围绕机器学习和运筹优化分享三个具体的实例。

 

案例介绍

第一个案例是智能农业。主要涉及养殖和种植。背后涉及的知识点是深度学习模型压缩与加速。 第二个案例是计算资源优化。它是运筹学比较关注的问题。第三个案例是新零售。本文将从算法和架构的角度,提供一些新的视角。我们的最终目的是希望通过机器学习使感知模型自动化,同时通过运筹优化使决策过程智能化。

 3ac11328096fc1b2c32f03778df56c250d5f9838


智能农业

下图展示了深度学习模型压缩与加速在应用集团内外的一些落地项目。


88175c67793e29f3b2c8b6d63f0c1a2d2015dabe


下面主要介绍在种植和养殖方面的实际应用。下图展示了“天蓬计划”这个项目是真实的部署在养殖场中的。从右侧这张图展示的是实时监控猪的数量。左侧这张图是用以确定猪的身份的,比如来源、成长曲线等一系列关键的参数信息。


1ff7bd993e69779262079990270130bc62ce7866


智能农业

通过无人机技术,我们希望能准确地获取农作物的生长状态信息。为承保、理赔提供参考信息,为实时监管提供有利的帮助。

 

b9ce3f033548c42598698d1be90fe8ef5b43f441


下图展示的也是一个实时部署系统。在下图中,我们识别出了玉米大多正处在开花期。不仅如此,还识别出了数量信息。

 

6c4ae57043313fd3c8cddb4e554a63db539b0bdd


下图展示了在烟草种植行业中的应用。左边的图,准确的识别出了棵树,为政府补贴和保险提供关键的信息。右图,烟草种植面积评估,对生产规划有着很重要的参考价值。

 

38a756d88b6a87b1b60c8c8a80b27f2c89bd9bcf


相关算法

这些应用的背后都需要强大的算法支持。在云端,我们有自己的训练平台,在移动端有嵌入式系统。但应用时还是存在一些问题亟待解决。

 

9fced9bc575fc794551a0a062d132f04859bab4c


为此我们提出了Gauss作为解决方案。


fe1580325e81f47e87dc8d7152348015b01e6b5d


在服务器端,有Gauss训练平台,集合了目前业界比较先进的算法进行模型的加速。并且,在过程中,我们也在自行开发新的技术,比如模型离散技术。在部署时也进行了优化,比如智能盒子。在之前提到的养猪实例中,就有智能盒子支持的摄像头。

 

下图列出了高效前向推理中的主要技术要点。

 

ddd18c9e05c7f12d9f8e3687acb778dfe090edf8

 

下面介绍有关计算资源优化的内容。由于我们内部管理了大量的数据中心,和海量的服务器,其中有极端复杂的技术。我们的目标是通过数据和算法得到最优的策略。主要的应用有三个。第一,优化预测。即根据趋势,在物体被分配之前,有针对性的找到可能的关注点。第二,优化配置。比如容器资源分配,不能多也不能少。第三,异常检测。在智能运维中有比较重要的应用。

 

5c4c02eca2cea2f82a4bf786b99eddb4077d3e6b


下面给大家详细介绍一下资源调度的问题。它的基本模型非常简单,但在实际应用上是不可行的。主要的问题在于实际应用中异常复杂的约束关系。

 

fe3744f2b2c2759d5aec3e57639e447c0464f021


下图给出了三个真实的计算资源优化实例。每张图的左边和右边都展示了上线前和上线后的区别。

 

715f61d2d40497bb8e4812efd035e72acb6aa451


新零售

下面介绍新零售方面的应用。关键点在于。下面主要从算法架构的角度来讲述对新零售的理解。一个非常成功的案例就是盒马新零售。盒马是一个线上线下合一的自营体系。每一个店面分为两个部分。一部分是前台实体店面,另一个部分是仓储。前台主要服务的是线下的客户,仓储主要服务的是线上的客户。一个盒马店面实际上只有30%左右线下用户,有超过70%的用户是线上的。这种生态系统与传统的电商,比如淘宝,不一样。在线下的角度,它与菜鸟等,也不一样。在算法的角度,线上,不仅要关注用户的偏好,还要关注库存,也就是说线上对线下的库存起到导入的作用。在线下库存的角度,做库存和运营配送时也要考虑线上的作用。线上线下实际上是一个有机的整体,它跟菜鸟、淘宝这样的重量级系统是不太一样的。同时,这也造成了一系列的算法挑战。

 

 0b6ed4b3da218af99216b10dec1ba56cdcf5d820

 

第一,线上部分,用户行为偏好问题。我们可以从三个层次来理解这个问题。一,线下活跃但线上沉睡的客户。第二,新用户。第三,活跃用户个性化。

 

e79d726c7b20cc12879888ed1227f2681c5f8b74


第二个问题是,线上精准营销的匹配问题,如下图。

 

10d641164673d4e9b87eea91c5131fae4543236e


第三,是线下配送问题。线上会源源不断的产生订单。订单都会有各自的配送时间和地点。这个问题的解决方案就是合批集单。

 

394a4f525794968181004ca5461779b7909b4d49


关于线下集单优化问题,如下图。

 

0fc5ebaefb1391fcce9883e0a1f27994ab1d7d22


最后,从算法角度介绍一下新零售。除了之前提到的线上线下。还有一个问题就是运营。运营可以实时地获取新闻、交通、天气,并输入到线上和线下以起到调控的作用。

 

283ef21e6a1dfd954b97160dc8b272f5d4fb8800


最后回归到人,技术最终是为了服务于人。希望能通过机器学习和运筹优化在更多行业起到助力的作用。


0f23202aff6e6458f4e6bc4a0bff452b11b2e55f

本文由云栖志愿小组马JY整理

猜你喜欢

转载自yq.aliyun.com/articles/592921
今日推荐