文章/答案/技术大牛

发布

社区首页 >问答首页 >使用强化学习解决分类问题

问使用强化学习解决分类问题
EN

Stack Overflow用户

提问于 2017-06-17 00:31:11

回答 3查看 7.7K关注 0票数 11

我可以在分类中使用强化学习吗？比如人类活动识别？又是如何做到的？

machine-learning

classification

reinforcement-learning

回答 3

Stack Overflow用户

发布于 2017-06-19 06:51:03

反馈有两种类型。一种是用于强化学习方法的evaluative，另一种是用于监督学习的instructive，主要用于分类问题。

当使用监督学习时，基于训练数据集中提供的正确标签的信息来调整神经网络的权重。因此，一旦选择了错误的类别，损失就会增加，权重也会进行调整，这样对于这种类型的输入，就不会再次选择错误的类别。

然而，在强化学习中，系统探索所有可能的动作，在这种情况下，各种输入的类标签，并通过评估奖励来决定什么是正确的，什么是错误的。情况也可能是这样，在它得到正确的类标签之前，它可能会给出错误的类名，因为这是到目前为止它找到的最好的可能输出。因此，它没有利用我们所拥有的关于类别标签的特定知识，因此与监督学习相比，它显著降低了收敛速度。

你可以使用强化学习来解决分类问题，但它不会给你带来任何额外的好处，反而会减慢你的收敛速度。

票数 9

Stack Overflow用户

发布于 2017-06-17 06:11:45

简短的回答是:是的。

详细的回答:是的，但这是一种过度的杀伤力。当你没有带标签的数据集来学习正确的策略时，强化学习是很有用的，所以你需要根据奖励制定正确的策略。这也允许通过不可微块进行反向传播(我想这不是您的情况)。强化学习方法最大的缺点是通常需要很长的时间才能收敛。所以，如果你有标签，使用常规的监督学习会更快更容易。

票数 5

Stack Overflow用户

发布于 2020-11-28 14:18:54

您可以开发一个RL模型来选择要使用的分类器。gt标签用于训练分类器，这些分类器的性能变化是对RL模型的奖励。正如其他人所说，如果它真的收敛，可能需要很长时间。这个想法可能还需要许多技巧和调整才能实现。我建议搜索关于这个主题的研究论文。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/44594007

复制

相似问题

问使用强化学习解决分类问题
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用强化学习解决分类问题EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用强化学习解决分类问题
EN