首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >“强化学习”在监督学习模型中的应用

“强化学习”在监督学习模型中的应用
EN

Stack Overflow用户
提问于 2019-07-11 10:03:06
回答 2查看 418关注 0票数 0

是否可以在有监督的模型上使用“强化学习”或反馈回路?

我使用监督学习模型(更确切地说是线性回归模型)解决了一个机器学习问题,但我希望通过对预测输出创建一个反馈环来改进结果,即如果算法在某些例子上出错,就告诉算法。

据我所知,这基本上就是强化学习的工作原理:该模型从正负反馈中学习。

我发现我们可以使用PyBrain实现有监督学习和强化学习算法,但我无法找到两者之间的关联方法。

EN

回答 2

Stack Overflow用户

发布于 2019-07-11 11:20:35

大多数(或全部)迭代监督学习方法已经对预测的输出使用了反馈循环。事实上,这种反馈信息非常丰富,因为它提供了每个示例中的确切错误量的信息。例如,在随机梯度下降中,计算每个样本的误差以更新模型参数。

在强化学习中,反馈信号(即奖励)比监督学习更有限。因此,在调整某些模型参数的典型设置中,如果有一组输入输出(即训练数据集),则可能没有应用强化学习的意义。

如果你在考虑一个更具体的案例/问题,你应该在你的问题上更加具体。

票数 0
EN

Stack Overflow用户

发布于 2019-07-16 19:57:54

强化学习被用来调整超参数和/或选择最优的监督学习模型。还有一篇关于它的论文:“学会用强化学习来优化”。

阅读巴勃罗的答案,你可能想读一读“反向传播”。这可能是你要找的东西。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56986663

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档