文章/答案/技术大牛

发布

社区首页 >问答首页 >代理协作推送块不返回奖励

问代理协作推送块不返回奖励
EN

Stack Overflow用户

提问于 2021-10-04 07:14:01

回答 1查看 158关注 0票数 1

我正在使用协同推块环境( https://github.com/Unity-Technologi...nvironment-Examples.md#cooperative-push-block) (为了使用Python而导出)，使用最新的稳定版本。问题是，我没有得到奖励(积极或消极)。总是0。如果我导出单推送块环境，我将正确地收到奖励。下面是我从collab示例https://github.com/Unity-Technologies/ml-agents/blob/main/docs/Python-API.md中使用的代码

decision_steps, terminal_steps = env.get_steps(behavior_name)
if tracked_agent in decision_steps:
    episode_rewards += decision_steps[tracked_agent].reward

print('REWARD', decision_steps.reward) # Always 0
# Each decision_steps[tracked_agent].reward also returns 0

我应该得到一个负面的惩罚(-0.0001)或一个积极的信号+1，+2，+3，根据文档。即使他们随机地推了一个街区，我也会得到0作为奖励。

他们在文档中说，奖励是作为“组奖励”给予的。我不知道这是否意味着改变了上面的代码。

unity3d

artificial-intelligence

ml-agent

python

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-10-06 07:04:54

我已经从问题部分收到了这个答复：

DecisionStep还有一个独立于奖励字段的group_reward字段。给合作普什布洛克特工的团体奖励应该在这里。我们很抱歉，collab没有明确指出这一点，我会对其进行更新。

https://github.com/Unity-Technologies/ml-agents/issues/5567

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/69432159

复制

相似问题

问代理协作推送块不返回奖励
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问代理协作推送块不返回奖励EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问代理协作推送块不返回奖励
EN