首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >为什么没有DQN而没有深度Sarsa?

为什么没有DQN而没有深度Sarsa?
EN

Data Science用户
提问于 2022-05-10 12:22:25
回答 1查看 82关注 0票数 0

为什么DQN经常使用,而几乎没有发生深萨萨?我发现这篇论文https://arxiv.org/pdf/1702.03118.pdf使用它,但没有其他可能相关的。我认为原因可能是Ape-X架构,它出现在Deep论文之后的一年,并允许为非策略算法产生大量的经验。这是有意义的,还是他们的其他原因?

EN

回答 1

Data Science用户

回答已采纳

发布于 2022-05-10 12:47:43

非策略学习允许您使用经验回放,这是一个有限的历史桶存储最近的经验,然后您可以使用它来随机抽样一小部分事件,并培训您的模型在这些事件。这样做是为了打破事件的自相关性(结果越接近时间),这会在训练神经网络时产生问题。这种方法不能用于SARSA,因为它使用下一个动作来训练模型。我确信有人已经想出了一些方法来破解这个问题,但是它并不是真正的目的。

票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/110831

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档