开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >Q-value在训练DQN时不断递减

问Q-value在训练DQN时不断递减
EN

Stack Overflow用户

提问于 2017-11-28 17:07:19

回答 1查看 231关注 0票数 0

我正在训练一个DQN，Q值一直在下降。曲线看起来非常奇怪(见下文)。

每一步都对应于对目标网络的更新。发生这种情况的可能原因是什么？

reinforcement-learning

EN

回答 1

Stack Overflow用户

发布于 2018-06-22 22:19:30

该步骤是否对应于Target Q网络更新？如果是这样，请尝试：

1)降低更新TargetQ网络的频率

2)增加折扣因子(例如，如果您使用的是.5，则为.99 )

3)以(1 - tau)_old + tau_v1的形式对TargetQ网络进行平滑更新

票数 1

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/47527648

复制

相似问题