AMiner会议论文推荐第五十期

AMiner平台由清华大学计算机系研发，拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱，提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线，吸引了全球220个国家/地区1000多万独立IP访问，数据下载量230万次，年度访问量超过1100万，成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

ICLR 2021 论文推荐

Model-Based Visual Planning with Self-Supervised Functional Distances（基于模型的视觉规划与自我监督的功能距离）

论文链接：https://www.aminer.cn/pub/5fef0fba91e0113b265a00c2/?conf=iclr2021

推荐理由： 本文入选ICLR 2021 Spotlight。一个通用型机器人需要在环境中完成各种任务。指定每个任务的优良方法有通过目标观察。然而，用强化学习来学习目标达成策略仍然是一个具有挑战性的问题，尤其是当手工设计的奖励函数不可用时。学习动力学模型是一种很有前景的方法，可以在没有奖励或任务导向数据的情况下对环境进行学习，但用这样的模型来规划达成目标，需要观察值和目标状态之间的功能相似性概念。作者提出了一种基于模型的视觉目标达成的自我监督方法，它同时使用视觉动力学模型以及使用无模型强化学习的动态距离函数。该方法使用离线、无标签的数据进行学习，使它可以实用于扩展到大型和多样化的数据集。在实验中，作者发现其方法可以成功地学习到在测试时执行各种任务的模型，用模拟的机械臂在分心器中移动物体，甚至可以学习使用真实世界的机器人打开和关闭抽屉。在比较中，作者发现这种方法大幅优于无模型和基于模型的先验方法。

在这里插入图片描述

Discovering a set of policies for the worst case reward（发现一套最坏情况下的回报政策）

论文链接：https://www.aminer.cn/pub/600834629e795ed227f53209/?conf=iclr2021

推荐理由： 本文入选ICLR 2021 Spotlight。作者研究如何构建一组可以共同组成的策略来解决一组强化学习任务的集合。其中，作者考虑了一类特定的策略组合，称之为集改进策略（set improving policies ，SIPs）：给定一组策略和一组任务，SIP是前者的任何组合，其性能在所有任务中至少和其组成者的性能一样好。作者专注于最保守的SIPs实例，即最大集策略（set-max policies，SMPs），因此其分析能够扩展到任何SIP。该工作的主要贡献是一种算法，它构建了一组策略，以便在任务集上最大化所产生的SMP的最差情况下的性能。该算法的工作原理是将新的策略连续添加到该集合中。作者称所产生的SMP的最差情况下的性能在每次迭代时都会严格改善，并且只有当不存在导致性能改善的策略时，算法才会停止。作者在网格世界和DeepMind控制套件的一组域上实证评估了上述算法。

在这里插入图片描述

A Panda? No, It’s a Sloth: Slowdown Attacks on Adaptive Multi-Exit Neural Network Inference（是熊猫？不，是一只树懒。对自适应多出口神经网络推断的减速攻击）

论文链接：https://www.aminer.cn/pub/5f7d8f8b91e011346ad27d99/?conf=iclr2021

推荐理由： 本文入选ICLR 2021 Spotlight。最近深度神经网络(deep neural networks, DNN)的计算需求增加，加上观察到大多数输入样本只需要简单的模型，引发了人们对输入-自适应-多出口架构的兴趣，如MSDNets或Shallow-Deep Networks。这些架构可以实现更快的推理，并可以将DNNs带入低功耗设备，例如物联网（Internet of Things，IoT）。然而，它们所提供的计算节省是否能够稳健地抵御对手的压力还不得而知。对手可能通过增加其平均推理时间来减慢自适应DNNs的速度——这类似于来自互联网的拒绝服务攻。在本文中，作者通过在两个流行的图像分类基准(CIFAR-10和Tiny ImageNet)上实验三个通用的多出口DNN(基于VGG16、MobileNet和ResNet56)和一个定制的多出口架构，对这种威胁进行了系统的评估。为此，该工作展示了对抗性样本制作技术能够被修改以导致减速，提出了一个衡量标准来比较它们对不同架构的影响。结果表明，在典型的物联网部署中，减速攻击会使多出口DNN的功效降低90%-100%，并且会将延迟放大1.5-5倍。

在这里插入图片描述

AMiner，一个具有认知智能的学术搜索引擎：https://www.aminer.cn/

#AMiner# #论文#

AMiner会议论文推荐第五十期

ICLR 2021 论文推荐

猜你喜欢