我是新的领域的RL,目前试图培训一个在线的DQN模式。一个在线模型会不会因为它一直在学习而变得过于适合?我怎么知道会不会发生这种事?
发布于 2021-10-07 23:01:26
过度拟合是训练和预测之间有意义的性能下降。任何型号都能过关。在线DQN模型可能会随着时间的推移而继续使用数据,但不会做出有用的预测。
https://datascience.stackexchange.com/questions/102353
相似问题