首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >批量Q学习与成长批量Q学习的区别

批量Q学习与成长批量Q学习的区别
EN

Stack Overflow用户
提问于 2015-09-28 14:10:58
回答 1查看 727关注 0票数 3

我对批量学习和成长的批量Q学习之间的区别感到困惑。此外,如果我只有历史数据,我能实现成长批量Q学习吗?

谢谢!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-10-26 17:03:20

在批量Q学习中,您只有历史数据,不可能按照给定的策略请求新的数据。相反,在不断增长的批量Q学习中,algoritm几乎是相等的,不同的是,在某些迭代中,您使用中间策略获取更多的数据,从而使用新的数据(包括探索)来增长这批数据。

因此,如果您只有历史数据,则不可能使用新数据来扩展批处理。也就是说,在你的情况下不可能实现不断增长的批量Q-学习。

你可以在这本书的第二章读到一个详细的解释: Wiering,Marco,y Martijn van Otterlo,编辑。强化学习:最新进展。2012年,庭编。斯普林格,2012年。链接到本章

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32825178

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档