AMiner会议论文推荐第四十六期

AMiner平台由清华大学计算机系研发，拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱，提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线，吸引了全球220个国家/地区1000多万独立IP访问，数据下载量230万次，年度访问量超过1100万，成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

ICLR 2021 论文推荐

Geometry-Aware Gradient Algorithms for Neural Architecture Search

论文链接：https://www.aminer.cn/pub/5e997e4591e01118b66a5ed5/?conf=iclr2021

**推荐理由：**本文入选ICLR 2021 Spotlight。许多先进的神经架构搜索(neural architecture search, NAS)方法将NAS问题放宽为对架构参数及其共享权重的联合连续优化，使得标准的基于梯度的优化器得以应用。引用镜像下降理论，作者提出了一个统一的框架，它利用底层问题结构快速找到高性能的架构以设计和分析基于梯度的NAS方法。该工作的几何感知框架带来了简单而新颖的算法，这些算法(1)比现有的基于梯度的方法有着更快的收敛保证，(2)在计算机视觉领域最新的NAS基准上达到了最高的精度。

在这里插入图片描述

Watch-And-Help: A Challenge for Social Perception and Human-AI Collaboration

论文链接：https://www.aminer.cn/pub/5f8fff9a91e01125c27ddec8/?conf=iclr2021

推荐理由： 本文入选ICLR 2021 Spotlight。作者介绍了Watch-And-Help（WAH），一个测试代理中社会智能的挑战。在WAH中，一个AI代理需要帮助一个私人代理高效地执行一项复杂的家庭任务。其中，AI代理需要：i)通过观看类人代理执行相同任务的单次演示，了解任务的基本目标(社会感知)；ii)与类人代理协调，在看不见的环境中尽快解决任务(人与AI协作)。针对这一挑战，作者构建了一个多代理家庭环境VirtualHome-Social，并提供了一个基于规划和学习的基准。作者使用客观指标和用户主观评价来评估AI代理与类人代理以及真实人类的性能。实验结果表明，上述挑战和虚拟环境能够对机器社交智能进行大规模的系统评估。

在这里插入图片描述

Self-Supervised Policy Adaptation during Deployment

论文链接：https://www.aminer.cn/pub/600833bb9e795ed227f531b6/t?conf=iclr2021

推荐理由： 于大多数现实世界的场景中，在一个环境中通过强化学习训练的策略需要部署在另一个可能完全不同的环境中。然而，跨环境的泛化是很困难的，其中一个自然的解决方案是在新环境中部署后继续训练，但如果新环境不提供奖励信号，上述方案无法实现。作者探索了使用自我监督来允许策略在部署后继续训练而不使用任何奖励的方法。该工作在DeepMind Control套件和ViZDoom的不同模拟环境中，及在不断变化的环境中的真实机器人操作任务上进行了实证评估，其方法在32个环境中的28个环境中提高了各种任务的泛化能力，并在大多数环境中优于领域随机化。

在这里插入图片描述

AMiner，一个具有认知智能的学术搜索引擎：https://www.aminer.cn/

#AMiner# #论文#

AMiner会议论文推荐第四十六期

ICLR 2021 论文推荐

猜你喜欢