读书笔记15:VAIN:Attentional Multi-agent Predictive Modeling

https://arxiv.org/pdf/1706.06122.pdf

摘要:首先介绍背景,multi-agent predictive modeling是理解很多系统的关键;然后一句话介绍现有情况,最近IN模型被提出,用来解决multi-agent physical system,然后指出这个系统的不足是计算量随着interaction的指数变化;之后提出本文提出一个随着agent数量线性变化的模型;最后指出本文提出的模型在实验中获得了良好的表现。整个abstract的结构是:背景——现状——现状的不足——我们的方法——实验情况。

introduction,第一段指出multi-agent interaction的模拟是理解世界的关键,由此提出multi-agent interaction的推断是机器智能的重要一步。第二段指出multi-agent的问题和现今深度模型的擅长领域出入很大,并具体指出了是哪些方面使得现在的深度模型不能直接用来解决这个问题,也算是背景介绍,然后引出下一段当下的此方向研究状况,指出他们的不足,就开始引入自己的模型了,模型简介之后还是很常规的介绍了实验结果,最后一段概述了下文内容。

intro后面的一部分先是介绍并对比了三个模型,第一个是interaction network(IN),第二个是commnet,第三个是本文模型,IN是用一个神经网络来模拟计算每一个interaction,每次更新一个agent的信息的时候,都会计算所有与之相连的agent和这个agent之间的interaction,因此这个模型复杂度太高O(N^2),第二个是commnet,这个不计算两两之间的interaction,而是只为每一个agent计算一个interaction vector,之后不论计算哪个agent的更新值,就只要用这个事先计算的interaction vector就行,这样的算法复杂度为O(N),但是不计算interaction导致的模型能力下降也是一个硬伤。最后本文的模型大致是对于每一个agent先计算communication vector和attention vector,之后计算某一个agent更新值的时候,,其中中的xi就是agent i的特征向量,也就相当于处理了一下的agent i的信息,而这里的应该是少了一个上标c,因为前面都没有出现过这个。我们可以看出,其实本文的模型是将IN计算interaction的神经网络计算简化了,因此既保留了对interaction的考量,又不至于使计算量过大。此外,当物理系统的相互作用不是加性的,不能直接求和,模型会将求和项改为softmax求和

具体来介绍本文的模型,模型的结构图如下

可以清晰地看出模型的工作过程,首先,对每一个agent都进行两个embedding

                                                                                 

这个embedding是单纯为这个agent生成的feature

                                                                            

这个embedding分为两项,第一项是一个communication vector,第二个是一个attention,communication vector顾名思义,是agent之间进行communicate用的。文章中没有提到是什么函数,只是提到了是一个全连接网络。

计算完embedding之后,为每一个agent计算pooled feature

                                        

式子还避免了self connection,作者介绍说这种操作的动机是只计算那些相关度比较高的agent,用加权的方式把重要的赋予高权重,不重要的反之。作者还强调,虽然这种操作的数量也是与agent的数量的平方成正比的,但是还是比IN中那种计算interaction的方式要节省资源的多。

计算了pooled feature之后,Pi和原featureFi连接起来作为一个intermediate feature ,最终每个agent的输出也是由全连接网络进行计算的,如果是分类问题的话,结果会被输入到一个softmax层生成agent probability,即

                                                                

总结一下,这个文章其实也就是描述了一个类似于卷积网络的东西,本文的模型也好,提到的IN网络也好,和其他卷积模型的一个主要区别在于对interaction的关注较多,所以其实本文的模型可以概述为用一些精细的手段计算了agent之间的interaction,然后利用这些interaction来进行agent值的更新,相当于一层卷积网络,更新值(也就是pooled feature)和原feature合在一起(像一个residual),输入到一个decoder D中进行全连接操作,最后接一个softmax,如果是对graph整体分类,加一层整合所有节点feature的全连接层即可。

猜你喜欢

转载自blog.csdn.net/b224618/article/details/81744641