强化学习是关于agents，学习策略在环境中表现良好。因此，它们解决了不同的、更复杂的问题。理论上，您可以使用RL学习整洁，因为您可能会提出“给定一个神经网络作为一个状态，学习如何随着时间的推移修改它以获得更好的性能”。关键的区别在于--整洁的输出是一个网络，RL输出是一个策略、策略、算法.在某些环境中可以多次使用的东西，采取行动并获得回报。

票数 6

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/42317356

复制

相似问题

问整洁与强化学习的关系是什么？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问整洁与强化学习的关系是什么？EN