首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在某些连续空间的RL库中,可以通过舍入来实现离散空间的强化学习算法吗?

在某些连续空间的RL库中,可以通过舍入来实现离散空间的强化学习算法吗?
EN

Stack Overflow用户
提问于 2022-01-21 05:46:02
回答 1查看 133关注 0票数 0

对于离散的动作空间环境,RL算法可以通过简单地映射(或舍入)agent在连续空间范围(健身房环境)中的动作到openai健身房环境中的离散动作来实现RL算法吗?

EN

回答 1

Stack Overflow用户

发布于 2022-01-21 20:36:08

是的,它是双向工作的,对于具有动作空间A_E的环境E,您只需定义一个包装器W,这样W(A)就有您所选择的动作空间A_W,并且它只是在中间转换动作。现在,这是最有效的方法吗?可能不会,通常使用--任何已知的问题结构--都会带来更好的结果。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/70796917

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档