首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >具有负值的OpenAi-Gym离散空间

具有负值的OpenAi-Gym离散空间
EN

Stack Overflow用户
提问于 2019-11-13 19:26:56
回答 1查看 1.1K关注 0票数 2

我已经创建了一个自定义的健身房环境,其中的动作可以是-100到+100之间的任何整数。据我所知,不可能创建一个允许负值的离散空间,我提供的唯一解决方案是创建一个从-100到+100的Box空间(请注意,这是一个连续的空间)。

由于大多数强化学习代理假定动作空间为离散空间,因此我在运行代码时遇到了困难(我知道有一些代理运行在连续的操作空间中,比如DDPG )。

在健身房里有可能有一个允许负值的离散空间吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-11-14 00:17:28

AFAIK,在OpenAI-Gym离散环境中,您对每个可能的操作都有索引,因为您可能不需要负值。但是,您可以将每个操作索引映射为任意值(正值或负值)。

例如,在Cartpole环境中,可以对购物车应用正(向右推)或负(向左推)力。这个问题是使用离散环境建模的,其中action 0 = negative forceaction 1 = positive force。有关更多详细信息,请查看Cartpole source code (例如,第95行)。

类似地,在您的案例中,尽管您的200个操作索引都是积极的,但它们可以代表积极或消极的行动。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58836093

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档