首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用强化学习解决分类问题

使用强化学习解决分类问题
EN

Stack Overflow用户
提问于 2017-06-17 00:31:11
回答 3查看 7.7K关注 0票数 11

我可以在分类中使用强化学习吗?比如人类活动识别?又是如何做到的?

EN

回答 3

Stack Overflow用户

发布于 2017-06-19 06:51:03

反馈有两种类型。一种是用于强化学习方法的evaluative,另一种是用于监督学习的instructive,主要用于分类问题。

当使用监督学习时,基于训练数据集中提供的正确标签的信息来调整神经网络的权重。因此,一旦选择了错误的类别,损失就会增加,权重也会进行调整,这样对于这种类型的输入,就不会再次选择错误的类别。

然而,在强化学习中,系统探索所有可能的动作,在这种情况下,各种输入的类标签,并通过评估奖励来决定什么是正确的,什么是错误的。情况也可能是这样,在它得到正确的类标签之前,它可能会给出错误的类名,因为这是到目前为止它找到的最好的可能输出。因此,它没有利用我们所拥有的关于类别标签的特定知识,因此与监督学习相比,它显著降低了收敛速度。

你可以使用强化学习来解决分类问题,但它不会给你带来任何额外的好处,反而会减慢你的收敛速度。

票数 9
EN

Stack Overflow用户

发布于 2017-06-17 06:11:45

简短的回答是:是的。

详细的回答:是的,但这是一种过度的杀伤力。当你没有带标签的数据集来学习正确的策略时,强化学习是很有用的,所以你需要根据奖励制定正确的策略。这也允许通过不可微块进行反向传播(我想这不是您的情况)。强化学习方法最大的缺点是通常需要很长的时间才能收敛。所以,如果你有标签,使用常规的监督学习会更快更容易。

票数 5
EN

Stack Overflow用户

发布于 2020-11-28 14:18:54

您可以开发一个RL模型来选择要使用的分类器。gt标签用于训练分类器,这些分类器的性能变化是对RL模型的奖励。正如其他人所说,如果它真的收敛,可能需要很长时间。这个想法可能还需要许多技巧和调整才能实现。我建议搜索关于这个主题的研究论文。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44594007

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档