首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在强化学习中,当动作不影响状态时,它叫什么?

在强化学习中,当动作不影响状态时,它叫什么?
EN

Stack Overflow用户
提问于 2018-05-19 09:35:38
回答 1查看 273关注 0票数 2

在强化学习中,对于所采取的操作不会影响状态的算法,是否有一个名称?例如武装土匪

EN

回答 1

Stack Overflow用户

发布于 2018-05-19 10:04:13

在RL设置中,armed bandits被认为是无状态的,因此操作自然不会影响状态。只有行动和奖励。

如果您添加了一个状态,但这些操作对下一个状态没有影响,则这些操作称为Contextual Bandits。上下文强盗有状态、动作和奖励。你的状态(或“上下文”)可能会影响你的行为,但不会反过来,也就是说,没有像普通RL中那样的转换规则。

票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50421014

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档