文章/答案/技术大牛

发布

社区首页 >问答首页 >Q学习agent的学习速率

问Q学习agent的学习速率
EN

Stack Overflow用户

提问于 2015-10-08 09:31:12

回答 3查看 9.5K关注 0票数 6

学习速度如何影响收敛速度和收敛本身的问题。如果学习速率是常数，Q函数会收敛到最优的on还是学习速率一定会衰减以保证收敛？

q-learning

machine-learning

reinforcement-learning

回答 3

Stack Overflow用户

回答已采纳

发布于 2017-07-11 11:48:59

学习速率告诉解决方案所采取的步骤的大小。

它不应该是太大的，一个数字，因为它可能会在极小值附近不断振荡，而不应该是一个数的太小的，否则它将需要大量的时间和迭代才能达到最小值。

在学习速率上建议衰减的原因是，最初当我们在解空间中的完全随机点时，我们需要向解的方向迈出很大的一步，然后当我们接近它时，我们会进行小的跳跃，从而得到小的改进，最终达到最小值。

类推可以说是:在高尔夫球场的比赛中，当球离洞很远时，球员很难打到离洞越近越好。后来，当他到达标记区时，他选择了另一根棍子，以获得精确的短拍。

所以，并不是说他不选择短杆就不能把球放进洞里，他可能会在目标前面投球两三次。但是，如果他发挥得最好，并使用适当的力量到达洞，那将是最好的。腐朽的学习率也是如此。

票数 7

Stack Overflow用户

发布于 2016-02-27 09:32:35

学习速度必须衰退，但不要太快。汇合的条件如下(抱歉，没有胶乳)：

和(α(T)，1，inf) = inf
和(α(T)^2，1，inf) < inf

类似alpha = k/(k+t)的东西可以很好地工作。

本文正是对这一问题进行了探讨：

http://www.jmlr.org/papers/volume5/evendar03a/evendar03a.pdf

票数 2

Stack Overflow用户

发布于 2016-01-28 13:02:59

它应该衰败，否则会出现一些波动，引发政策上的小变化。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/33011825

复制

相似问题

问Q学习agent的学习速率
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Q学习agent的学习速率EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Q学习agent的学习速率
EN