AMiner会议论文推荐第四十九期

AMiner平台由清华大学计算机系研发，拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱，提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线，吸引了全球220个国家/地区1000多万独立IP访问，数据下载量230万次，年度访问量超过1100万，成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

ICLR 2021 论文推荐

Mutual Information State Intrinsic Control（相互信息状态内在控制）

论文链接：https://www.aminer.cn/pub/600832969e795ed227f5311f/?conf=iclr2021

推荐理由： 本文入选ICLR 2021 Spotlight。强化学习在许多具有挑战性的任务中取得非常好的成绩。然而，它的成功在很大程度上依赖于形状良好的奖励。内在激励RL试图通过定义内在奖励函数来消除这种约束。在心理学中自我意识概念的启发下，作者做了一个自然的假设，即代理知道什么是自己，并提出了一个新的内在目标，鼓励代理对环境有最大的控制。该工作在数学上将这种奖励形式化为当前代理策略下代理状态与周围状态之间的相互信息。在这种新的内在动机下，模型能够超越之前的方法，首次在不使用任何任务奖励的情况下完成拾取和放置任务。

在这里插入图片描述

PlasticineLab: A Soft-Body Manipulation Benchmark with Differentiable Physics（PlasticineLab: 具有差异化物理学的软体操纵基准）

论文链接：https://www.aminer.cn/pub/600834009e795ed227f531d8/?conf=iclr2021

推荐理由： 本文入选ICLR 2021 Spotlight。模拟虚拟环境是开发和评估技能学习算法的主要动力之一。然而，现有的环境通常只模拟刚体物理学。此外，模拟过程通常不提供可能对规划和控制优化有用的梯度。作者引入了一个新的可区分的物理学基准，称为PasticineLab，其中包括一个多样化的软体操纵任务集合。在每个任务中，代理使用操纵器将塑性体变形为所需配置。底层物理引擎使用DiffTaichi系统支持可分化的弹性和塑性变形，给机器人代理提出了许多挑战。作者在上述基准上评估了几种现有的强化学习（RL）方法和基于梯度的方法。实验结果表明：1）基于RL的方法难以高效地解决大部分任务；2）基于梯度的方法，通过优化开环控制序列与内置的可分化物理引擎，能够在数十次迭代内快速找到解决方案，但在需要长期规划的多阶段任务上仍有不足。该工作期望PlasticineLab能够鼓励开发结合可分化物理学和RL的新型算法，用于更复杂的基于物理学的技能学习任务。

在这里插入图片描述

Learning from Protein Structure with Geometric Vector Perceptrons（用几何向量感知器学习蛋白质结构）

论文链接：https://www.aminer.cn/pub/5f53599a91e0110c40a7bc91/?conf=iclr2021

推荐理由： 本文入选ICLR 2021 Spotlight。在大型生物分子的三维结构上进行学习，正在成为机器学习中一个独特的领域，但还没有出现一个同时利用图结构和几何方面的统一网络架构。为了解决这一问题，作者引入了几何向量感知器，它扩展了标准的密集层，能够在欧几里得向量的集合上进行操作。配备这种层的图神经网络能够对大分子结构的高效和自然表示进行几何和关系推理。作者在蛋白质结构学习的两个重要问题上展示了其方法：模型质量评估和计算蛋白质设计。该方法比现有的架构类别有所改进，包括最先进的基于图的和基于voxel的方法。

在这里插入图片描述

AMiner，一个具有认知智能的学术搜索引擎：https://www.aminer.cn/

#AMiner# #论文#

AMiner会议论文推荐第四十九期

ICLR 2021 论文推荐

猜你喜欢