问对AWS Deep Racer中先前创建的奖励功能的思考
EN

Stack Overflow用户

提问于 2019-10-25 20:02:18

回答 1查看 257关注 0票数 1

假设我创建了一个奖励fn。然后训练我的模型。然后，我克隆模型并对奖励fn进行更改。(让我们说奖励fn。B)并训练它。所以最终的模型也有从奖励fn中学习到的东西。A和B，或者它忘记了从fn中学习。A，并且只从奖励fn得到训练。B？

发布于 2020-02-23 07:29:03

克隆一个经过训练的模型，继续训练以提高性能。

它应该继续训练。我也试着克隆并继续使用不变的奖励函数，结果在开始时已经比第一次尝试好得多。

但我可以想象，如果你改变你的函数，后面训练的神经网络将随着每一集新的剧集越来越多地适应你的新奖励函数B。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/58558168

复制

相似问题

问对AWS Deep Racer中先前创建的奖励功能的思考EN