文章/答案/技术大牛

发布

社区首页 >问答首页 >“强化学习”在监督学习模型中的应用

问“强化学习”在监督学习模型中的应用
EN

Stack Overflow用户

提问于 2019-07-11 10:03:06

回答 2查看 418关注 0票数 0

是否可以在有监督的模型上使用“强化学习”或反馈回路？

我使用监督学习模型(更确切地说是线性回归模型)解决了一个机器学习问题，但我希望通过对预测输出创建一个反馈环来改进结果，即如果算法在某些例子上出错，就告诉算法。

据我所知，这基本上就是强化学习的工作原理:该模型从正负反馈中学习。

我发现我们可以使用PyBrain实现有监督学习和强化学习算法，但我无法找到两者之间的关联方法。

python

linear-regression

reinforcement-learning

supervised-learning

回答 2

Stack Overflow用户

发布于 2019-07-11 11:20:35

大多数(或全部)迭代监督学习方法已经对预测的输出使用了反馈循环。事实上，这种反馈信息非常丰富，因为它提供了每个示例中的确切错误量的信息。例如，在随机梯度下降中，计算每个样本的误差以更新模型参数。

在强化学习中，反馈信号(即奖励)比监督学习更有限。因此，在调整某些模型参数的典型设置中，如果有一组输入输出(即训练数据集)，则可能没有应用强化学习的意义。

如果你在考虑一个更具体的案例/问题，你应该在你的问题上更加具体。

票数 0

Stack Overflow用户

发布于 2019-07-16 19:57:54

强化学习被用来调整超参数和/或选择最优的监督学习模型。还有一篇关于它的论文：“学会用强化学习来优化”。

阅读巴勃罗的答案，你可能想读一读“反向传播”。这可能是你要找的东西。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/56986663

复制

相似问题

问“强化学习”在监督学习模型中的应用
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问“强化学习”在监督学习模型中的应用EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问“强化学习”在监督学习模型中的应用
EN