[ICLR2021] QPLEX: Duplex Dueling Multi-Agent Q-Learning 笔记

前言

该文章应该是线性值分解这类方法增强mixing network表达能力的终曲了,结构已经相当复杂,集中程度很高,不知道后面的线性值分解方法会怎么做。

其他人的介绍:https://zhuanlan.zhihu.com/p/201419315

QPLEX: DUPLEX DUELING MULTI-AGENT Q-LEARNING

ADVANTAGE-BASED IGM

从Dueling DQN中的分解

猜你喜欢

转载自blog.csdn.net/qq_38163755/article/details/111053811
今日推荐