首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >候选淘汰--新数据的分类

候选淘汰--新数据的分类
EN

Stack Overflow用户
提问于 2016-09-15 01:48:16
回答 1查看 604关注 0票数 1

我正在尝试理解version space learning和候选淘汰算法。使用这些具有以下属性的训练示例:

代码语言:javascript
复制
Sky, Temp, Humid, Wind, Water, Forecast, EnjoySport

以及相应的值:

代码语言:javascript
复制
<Sunny, Warm, Normal, Strong, Warm, Same,   Yes>
<Sunny, Warm, High,   Strong, Warm, Same,   Yes>
<Rainy, Cold, High,   Strong, Warm, Change, No>
<Sunny, Warm, High,   Strong, Cool, Change, Yes>

如果我执行候选剔除,我发现S (最具体的假设)和G (最一般的假设)是:

代码语言:javascript
复制
S: {<Sunny, Warm, ?, Strong, ?, ?>}
G: {<Sunny, ?, ? ,? ,?, ?>, <?, Warm, ?, ?, ?, ?>}

但是,如何对新数据进行分类呢?我的意思是,如果我有一个像这样的新数据点会发生什么?

代码语言:javascript
复制
<Sunny, Warm, Normal, Strong, Cool, Change>

这个算法会做什么?它会将新记录归类为正面还是负面?

我搜索了很多,但没有找到任何有用的东西。

EN

回答 1

Stack Overflow用户

发布于 2016-09-15 02:15:10

Wikipedia page

在学习之后,可以通过测试算法学习到的假设来对未见过的示例进行分类。如果该示例与多个假设一致,则可以应用多数投票规则。

<disclaimer>在没有太多学习</disclaimer>的经验的情况下,其目的是学习可能性空间中的一个区域,该区域可以由“一般”和“特定”边界描述,可能具有在它们之间插值的能力。

例如,您可能会考虑将<Sunny, ?, ? ,Strong ,?, ?>添加到包含的假设中,因为它位于<Sunny, Warm, ?, Strong, ?, ?><Sunny, ?, ? ,? ,?, ?>之间。

由边界标识的假设空间表示您的模型所学到的知识。其中的每个假设(比如<Sunny, ?, ? ,Strong ,?, ?>)要么匹配一个新的数据点,要么不匹配。然后由你来决定如何解释由此产生的“意见”。显然,把它放在“投票”上是很常见的。

总结一下:

  1. 枚举最具体和最一般的假设之间的所有假设,以及每个假设对新数据点的反应:它是说是还是不是?
  2. 新数据点是有更多的“是”票还是“否”票?这就是你给新点贴上的标签。

请注意,虽然上面的算法对于传达意图很好,但它可能会对性能造成负面影响。具体地说,可以一次考虑多组包含的假设。这样做可以减少所需的迭代次数。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/39496706

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档