我对批量学习和成长的批量Q学习之间的区别感到困惑。此外,如果我只有历史数据,我能实现成长批量Q学习吗?
谢谢!
发布于 2015-10-26 17:03:20
在批量Q学习中,您只有历史数据,不可能按照给定的策略请求新的数据。相反,在不断增长的批量Q学习中,algoritm几乎是相等的,不同的是,在某些迭代中,您使用中间策略获取更多的数据,从而使用新的数据(包括探索)来增长这批数据。
因此,如果您只有历史数据,则不可能使用新数据来扩展批处理。也就是说,在你的情况下不可能实现不断增长的批量Q-学习。
你可以在这本书的第二章读到一个详细的解释: Wiering,Marco,y Martijn van Otterlo,编辑。强化学习:最新进展。2012年,庭编。斯普林格,2012年。链接到本章
https://stackoverflow.com/questions/32825178
复制相似问题