首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >半监督学习测试数据

半监督学习测试数据
EN

Stack Overflow用户
提问于 2012-11-20 08:00:59
回答 1查看 1.8K关注 0票数 3

半监督学习使用一组标记数据(L)来训练一个模型来预测一组未标记数据(U),然后将新的标记数据(L‘)和原始标记数据(L)分组为完整的标记数据。

我想问一下如何提取测试数据。

  1. 我应该从(L联合L')中提取测试数据
  2. 我应该从(L)中提取测试数据。

哪一个是对的?

如果从(L并L')提取测试数据,结果就没有意义,因为L‘中的答案可能是错误的.?

==========================================================编辑新

我有另一个主意..。

  1. 在开始时,我应该将标记数据(L)拆分为训练数据(L_train)和测试数据(L_test)。

然后使用L_train训练模型,并利用它预测一组未标记数据(U),然后对预测结果(L‘)和L_train进行分组。

并使用L_train联合L‘来训练模型,在L_test上进行测试。

哪一个是对的1,2,3?谢谢你的回复。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-11-20 09:51:11

你用L训练你的分类器。您可以首先执行交叉验证以适应某些方法参数P。使用参数P,从标记的数据L构造模型M。然后使用模型M标记未标记的数据U。您可以将U中的示例(对分配的类最有信心)与L连接起来。然后重复这个过程,直到对所有示例进行分类。

-编辑-

我认为最合适的方法是第三种方法。但我可能不太明白,就这样吧。

您将L拆分为L_trainL_test。使用L_train对分类器进行培训,还可以使用此分类器对U进行分类(按照我前面描述的方法)。从标记UL_train的结合出发,构造了一个新的分类器,并使用它对L_test进行分类。这些分类的差异可用于评价措施(分类的准确性,.)。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/13468848

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档