首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于强化学习的多智能体连续空间路径搜索的最佳算法

基于强化学习的多智能体连续空间路径搜索的最佳算法
EN

Stack Overflow用户
提问于 2019-06-24 05:05:08
回答 1查看 326关注 0票数 0

我正在进行一个项目,在这个项目中,我需要在多agent场景中从1点到另一点在连续空间找到最佳的优化路径。我正在寻找适合这个问题的最佳算法,使用强化学习。我尝试过“多代理演员-评论家的混合合作竞争环境”,但它似乎没有达到目标,在10000个人。我如何改进这个算法,或者有没有其他的算法可以帮助我做到这一点。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-06-26 05:28:26

多agent强化学习很难掌握,在一般情况下还没有被证明是有效的。

问题在于,在多agent中,从每个个体agent的角度来看,环境变得非平稳。这意味着代理操作不能直接映射到状态,因为其他代理单独执行操作,这“混淆”了所有代理。这里有一个深入的多智能体研究的集合:https://github.com/LantaoYu/MARL-Papers

如果你想追求你所提到的演员批评方法,我建议你进一步研究:如果你想完善https://arxiv.org/pdf/1706.02275.pdf多代理演员评论家 (MADDPG)

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56730118

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档