首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >整洁与强化学习的关系是什么?

整洁与强化学习的关系是什么?
EN

Stack Overflow用户
提问于 2017-02-18 15:57:33
回答 1查看 4.9K关注 0票数 7

据我所知,train (增强拓扑的NeuroEvolution)是一种利用进化的概念来训练神经网络的算法。另一方面,强化学习是一种机器学习,其概念是“奖励”更成功的节点。

这两个领域之间有什么区别,因为它们似乎非常相似?还是从强化学习中衍生出来的整洁?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-02-19 00:27:30

简而言之,他们几乎没有任何共同点。

method是一种进化方法。这是一种优化函数的黑匣子方法。在这种情况下,神经网络的性能(它可以很容易地测量) wrt。它的架构(在进化过程中你会改变)。

强化学习是关于agents,学习策略在环境中表现良好。因此,它们解决了不同的、更复杂的问题。理论上,您可以使用RL学习整洁,因为您可能会提出“给定一个神经网络作为一个状态,学习如何随着时间的推移修改它以获得更好的性能”。关键的区别在于--整洁的输出是一个网络,RL输出是一个策略、策略、算法.在某些环境中可以多次使用的东西,采取行动并获得回报。

票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/42317356

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档