基于动态自选择参数共享的合作多智能体强化学习算法 - 代码天地

基于动态自选择参数共享的合作多智能体强化学习算法

企业开发 2023-12-17 20:06:41 阅读次数: 0

【摘要】在多智能体强化学习的研究中，参数共享作为学习过程中一种信息集中的方式，可以有效地缓解不稳定性导致的学习低效性。但是，在实际应用中智能体使用同样的策略往往会带来不利影响。为了解决此类过度共享的问题，提出了一种新的方法来赋予智能体自动识别可能受益于共享参数的智能体的能力，并且可以在学习过程中动态地选择共享参数的对象。具体来说，智能体需要将历史轨迹编码为可表示其潜在意图的隐信息，并通过与其余智能体隐信息的对比选择共享参数的对象。实验表明，提出的方法在多智能体系统中不仅可以提高参数共享的效率，同时保证了策略学习的质量。

【关键词】 多智能体系统 ; 强化学习 ; 参数共享

0 引言

多智能体强化学习（multi-agent reinforcement learning，MARL）旨在在共享环境中联合训练多个智能体从而完成给定的任务。近期，多智能体强化学习领域中应用非常广泛的是中心化学习去中心化执行（centralized learning decentralized execution，CTDE）的训练框架。CTDE框架使智能体在学习的过程中可以共享经验池中的历史轨迹，进行必要的信息互补，因此被广泛应用于多智能体强化学习的算法设计和实现中，例如：联合动作学习（joint action learning）、智能体建模（agent modelling）、多智能体通信（multi-agent communication）以及信任分配问题（credit assignment）。

然而，当多智能体系统（multi-agent system， MAS）规模较大时，

猜你喜欢

转载自blog.csdn.net/qq_61890005/article/details/134916579

基于动态自选择参数共享的合作多智能体强化学习算法

MABIM：多智能体强化学习算法的“炼丹炉”

多智能体强化学习理论与算法总结

MATLAB强化学习实战(十二) 创建自定义强化学习算法的智能体

FCP（虚拟合作）--- 无需人工生成数据训练强化学习智能体

用于衍生品定价和动态对冲的多智能体深度强化学习和基于 GAN 的市场模拟

多智能体强化学习

多智能体强化学习入门

基于强化学习的智能算法应用与开发

强化学习（四）：基于表格型动态规划算法的强化学习

强化学习--基于值函数的强化学习算法

强化学习——基于策略梯度的强化学习算法

多智能体强化学习入门（三）——矩阵博弈中的分布式学习算法

【NIPS 2017】基于深度强化学习的想象力增强智能体

论文阅读-基于深度强化学习的方法解决多智能体防御和攻击问题

基于多智能体深度强化学习的体系任务分配方法

强化学习：基于模型的动态规划

多智能体强化学习入门（五）——QMIX算法分析

【转载】多智能体强化学习入门（四）——MADDPG算法

基于policy gradient的强化学习算法

DeepMind开源强化学习库TRFL，可在TensorFlow中编写强化学习智能体

MATLAB强化学习实战(一) 强化学习智能体训练总览

MATLAB强化学习工具箱（十二）强化学习智能体创建总览

【强化学习论文】多智能体强化学习是一个序列建模问题

强化学习 RL -> DQN -> 智能体Agent

多智能体强化学习笔记 02

多智能体强化学习笔记 01

强化学习-智能体与环境交互过程2

多智能体强化学习之QMIX

多智能体强化学习之MADDPG

今日推荐

wlnmp 一键安装包更新 240522

ChatGPT 严重宕机，结果被造谣“遭遇俄罗斯黑客入侵”

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

周排行

010-题目：利用条件运算符的嵌套来完成此题：学习成绩>=90分的同学用A表示，60-89分之间的用B表示，60分以下的用C表示。

接口测试-工作心得记录八（使用locust库书写接口并发）

物理分页和逻辑分页

Hive建表语句详解--CREATE TABLE

爬虫学习----学习get和post请求

PDF生成类库

POJ 2139

前端路由基本原理

I/O多路转接之epoll

.NET开源项目 QuarkDoc 一款自带极简主义属性的文档管理系统

每日归档

更多

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)