搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

绘制多智能体的变量

我试图绘制一个图表，显示一个品种的所有代理变量。虽然代理的数量相当少，但我认为一定有一个更优雅的方法，而不是为每个代理创建一支笔。在那里吗?

浏览 2提问于2016-07-11得票数 2

3回答

python多智能体仿真软件包

Python中有没有可以用来模拟市场行为的多智能体模拟软件包？我试图安装SimPy，但它似乎并不合适。

浏览 0提问于2012-09-14得票数 3

4回答

多智能体游戏的Openai健身环境

在多智能体游戏中可以使用的吗?具体来说，我想用四个玩家(代理)来模拟一个纸牌游戏。得分的玩家将在下一个回合开始。我如何建模玩家之间的必要协调(例如，谁是下一个)？

浏览 5提问于2017-06-05得票数 29

回答已采纳

2回答

多智能体论证的简易Prolog实现

逻辑编程新手(Prolog)。遇到一个简单的问题，但不知道如何用prolog编码。你能举例说明如何实现这个扎根/1计划来实现这一目标吗？

浏览 0提问于2013-02-08得票数 2

回答已采纳

1回答

具有不同训练算法的多智能体RLIB

在RLLIB中，可以有多个具有不同学习算法的代理吗？(例如:一个使用DQN的代理和一个使用Q-Learning的代理)？

浏览 1提问于2020-02-24得票数 1

1回答

如何使用keras-rl进行多智能体训练

我正在尝试使用keras-rl，但使用的是多智能体环境。因此，我找到了这个，它的想法是为所有agents使用共享环境。不幸的是，我没有设法让它工作。

浏览 8提问于2017-11-09得票数 3

1回答

如何设计时钟驱动的多智能体仿真

我希望为一个真实的word制造过程建立一个多agent仿真模型，以评估一些调度规则。与实际的制造事件日志相比，仿真需要生成事件日志来评估调度规则的时间效果。如何将“当前仿真时间”融入这种多agent、消息传递的密集仿真中？在制造科学中，有成千上万的论文使用多智能体仿真来解决一些与制造相关的问题。然而，我还没有找到一篇论文来描述这些模拟的内部工作原理或实现细节。

浏览 3修改于2012-04-30得票数 3

回答已采纳

1回答

多智能体参数在Cygnus配置中的应用

在Cygnus组件的配置中，multiagent参数的用途是什么？

浏览 18提问于2019-03-05得票数 1

1回答

我试图用多and强化学习来模拟我的问题，到目前为止，我已经用DQN尝试过了，但是结果或多或少像一个随机方案。可能是为了了解其他用户的行为，用户没有多少上下文信息？或者还有别的原因吗？因此，我不确定这是一个部分可观察的MDP，还是应该被建模为多智能体单臂盗贼问题，我不知道是否正确。第二个问题是，我尝试过DQN，但它没有起作用，我想知道这种问题是否可以与表格式Q-学习一起使用？我从未见过有人使用QL的多代理作品。任何见解都可能有帮助。

浏览 6提问于2020-11-21得票数 0

1回答

每个Agent 2个动作的多智能体仿真

这是一个模拟代码，运行一个多智能体系统，开发来模拟价格如何波动的动态过程中，代理人作出他们的行动。每个代理可以根据其价值和价格做出“获取”或“删除”所选选项的决定。

浏览 0修改于2018-05-04得票数 3

回答已采纳

1回答

降低多智能体环境中单个智能体的动作采样频率

我是第一次使用rllib，并试图训练一个自定义的多代理RL环境，并希望在它上面训练几个PPO代理。我需要解决的实现问题是如何改变一个特殊代理的训练，使得这个代理每X个时间步才采取一个行动。

浏览 8提问于2020-07-14得票数 0

1回答

多智能体强化学习环境公共交通问题

在我的Msc论文中，我想把多智能体RL应用于一个总线控制问题。其想法是，巴士在给定的线路上运行，但没有时间表。

浏览 6修改于2020-10-31得票数 1

2回答

多智能体微观经济仿真中“值”的确定

我试图确定一种客观的方法，让一个自我利益的代理人在一个与Sugarscape (http://en.wikipedia.org/wiki/Sugarscape)相似的多agent模拟中，计算出最优的商品买卖价格

浏览 0修改于2014-03-03得票数 2

1回答

通过深度强化学习构建多智能体环境

在多智能体环境中，我应该创建自己的环境，并应用dqn算法.如何将其更改为多代理？2-如何更改以编写复位？(我应该将每个参数重置为0) 我编写了一些代码，但由于我是dqn和多代理方面的初学者，我看到了以下错误：(我知道它也存在一些与多代理相关的问题)。

浏览 1提问于2018-05-08得票数 0

1回答

多智能体健身房环境中的随机代理

我无法为多智能体健身房环境选择随机动作。[0] += action[0][1] - action[0][2]我找不到一个修复，因为没有足够的讨论这些多代理环境

浏览 0提问于2018-11-14得票数 2

回答已采纳

1回答

Kevin Leyton-Brown开发的多智能体学习算法评估平台GAMUT？

测试、开发、论文、算法、性能

这个里面介绍了一个评估多智能体学习算法性能的平台GAMUT，主要是通过生成一系列的博弈游戏来测试相应算法的性能，但是论文里面没有提及具体如何实现，只是给出了实验结果。有人知道应该怎么应用这一平台吗？

浏览 354提问于2018-04-11

1回答

多最小层多智能体pacman的极大极小算法实现问题

以下是多智能体pacman的minimax算法的代码片段，其中有多个幽灵(最小玩家)。

浏览 1提问于2015-03-09得票数 0

2回答

重量轻，行为驱动的多智能体机器人模拟器？

寻找一个机器人模拟器，它是多智能体，重量轻，行为驱动，和脚本，可视化运行时--它可能也是2D的。不需要将逻辑输出到现实世界。因此，到目前为止，我已经看过以下内容，其中没有一个具有半复杂的行为分配、呈现和报告：Algodoo:，它有2D物理，点-n-点击界面，但是在图形卡上很重，所以我已经测试了

浏览 6修改于2010-12-18得票数 2

回答已采纳

1回答

具有多智能体的应用程序看起来以随机速度工作。

我编写了一个Java代码，只是为了测试我的CPU在必须进行操作时将如何运行，所以我编写了循环，在100000000000次迭代中将1添加到var： public static void main(String[] args) { int sum = 0; for (int j=0;j<=10000;j++){

浏览 2修改于2015-12-30得票数 4

回答已采纳

1回答

基于强化学习的多智能体连续空间路径搜索的最佳算法

我正在进行一个项目，在这个项目中，我需要在多agent场景中从1点到另一点在连续空间找到最佳的优化路径。我正在寻找适合这个问题的最佳算法，使用强化学习。我尝试过“多代理演员-评论家的混合合作竞争环境”，但它似乎没有达到目标，在10000个人。我如何改进这个算法，或者有没有其他的算法可以帮助我做到这一点。

浏览 0提问于2019-06-24得票数 0

回答已采纳

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

绘制多智能体的变量

python多智能体仿真软件包

多智能体游戏的Openai健身环境

多智能体论证的简易Prolog实现

具有不同训练算法的多智能体RLIB

如何使用keras-rl进行多智能体训练

如何设计时钟驱动的多智能体仿真

多智能体参数在Cygnus配置中的应用

多智能体(不是深层)强化学习？问题建模

每个Agent 2个动作的多智能体仿真

降低多智能体环境中单个智能体的动作采样频率

多智能体强化学习环境公共交通问题

多智能体微观经济仿真中“值”的确定

通过深度强化学习构建多智能体环境

多智能体健身房环境中的随机代理

Kevin Leyton-Brown开发的多智能体学习算法评估平台GAMUT？

多最小层多智能体pacman的极大极小算法实现问题

重量轻，行为驱动的多智能体机器人模拟器？

具有多智能体的应用程序看起来以随机速度工作。

基于强化学习的多智能体连续空间路径搜索的最佳算法

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐