文章目录
前言
该文章应该是线性值分解这类方法增强mixing network表达能力的终曲了,结构已经相当复杂,集中程度很高,不知道后面的线性值分解方法会怎么做。
其他人的介绍:https://zhuanlan.zhihu.com/p/201419315
QPLEX: DUPLEX DUELING MULTI-AGENT Q-LEARNING
ADVANTAGE-BASED IGM
从Dueling DQN中的分解
该文章应该是线性值分解这类方法增强mixing network表达能力的终曲了,结构已经相当复杂,集中程度很高,不知道后面的线性值分解方法会怎么做。
其他人的介绍:https://zhuanlan.zhihu.com/p/201419315
从Dueling DQN中的分解