据我所知,train (增强拓扑的NeuroEvolution)是一种利用进化的概念来训练神经网络的算法。另一方面,强化学习是一种机器学习,其概念是“奖励”更成功的节点。
这两个领域之间有什么区别,因为它们似乎非常相似?还是从强化学习中衍生出来的整洁?
发布于 2017-02-19 00:27:30
简而言之,他们几乎没有任何共同点。
method是一种进化方法。这是一种优化函数的黑匣子方法。在这种情况下,神经网络的性能(它可以很容易地测量) wrt。它的架构(在进化过程中你会改变)。
强化学习是关于agents,学习策略在环境中表现良好。因此,它们解决了不同的、更复杂的问题。理论上,您可以使用RL学习整洁,因为您可能会提出“给定一个神经网络作为一个状态,学习如何随着时间的推移修改它以获得更好的性能”。关键的区别在于--整洁的输出是一个网络,RL输出是一个策略、策略、算法.在某些环境中可以多次使用的东西,采取行动并获得回报。
https://stackoverflow.com/questions/42317356
复制相似问题