首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在机器学习中使用反馈还是强化?

在机器学习中使用反馈还是强化?
EN

Stack Overflow用户
提问于 2014-04-04 05:16:55
回答 3查看 10K关注 0票数 16

我正试图解决一些分类问题。许多经典的方法似乎都遵循类似的范式。也就是说,使用一些训练集来训练一个模型,而不是用它来预测新实例的类标签。

我想知道是否有可能在范例中引入一些反馈机制。在控制理论中,引入反馈回路是提高系统性能的有效途径。

目前,我认为一个直接的方法是,首先我们从一组初始的实例开始,然后用它们来训练一个模型。然后,每次模型进行错误的预测时,我们将错误的实例添加到训练集中。这与盲目扩大训练集是不同的,因为它更有针对性。在控制理论中,这可以看作是某种负反馈

反馈方法是否正在进行研究?有人能给点线索吗?

EN

回答 3

Stack Overflow用户

发布于 2014-04-10 09:50:51

有两个领域的研究,春天的想法。

第一个是强化学习。这是一个在线学习范例,允许您在观察结果时获得反馈并更新您的策略(在本例中是您的分类器)。

第二个是主动学习,分类器可以从一个非分类示例池中选择要标记的示例。关键是在现有的分类器假设下,通过选择困难的样本,使分类器选择标注的样本,从而提高分类的准确性。

票数 10
EN

Stack Overflow用户

发布于 2014-04-05 21:41:22

我在的每一个机器学习项目中都使用了这样的反馈。它允许在较少的数据上进行训练(因此训练速度更快),而不是随机选择数据。与随机选取的训练数据相比,模型的精度也得到了快速的提高。我正在处理图像处理(计算机视觉)数据,所以我正在做的另一种选择是添加集群错误(错误)数据,而不是添加每一个虚假数据。这是因为我假设我总是会有一些失败,所以我对正数据的定义是当它聚集在图像的同一区域时。

票数 1
EN

Stack Overflow用户

发布于 2014-04-10 18:14:06

我不久前看到了本论文,这似乎就是你要找的东西。

它们基本上是将分类问题建模为马尔可夫决策过程,并使用ACLA算法进行求解。这篇论文比我在这里所能写的要详细得多,但最终他们得到的结果超过了多层感知器,所以这看起来是一种非常有效的方法。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/22854131

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档