首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Q-value在训练DQN时不断递减

Q-value在训练DQN时不断递减
EN

Stack Overflow用户
提问于 2017-11-28 17:07:19
回答 1查看 231关注 0票数 0

我正在训练一个DQN,Q值一直在下降。曲线看起来非常奇怪(见下文)。

每一步都对应于对目标网络的更新。发生这种情况的可能原因是什么?

EN

回答 1

Stack Overflow用户

发布于 2018-06-22 22:19:30

该步骤是否对应于Target Q网络更新?如果是这样,请尝试:

1)降低更新TargetQ网络的频率

2)增加折扣因子(例如,如果您使用的是.5,则为.99 )

3)以(1 - tau)_old + tau_v1的形式对TargetQ网络进行平滑更新

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47527648

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档