文章/答案/技术大牛

发布

社区首页 >问答首页 >半监督学习测试数据

问半监督学习测试数据
EN

Stack Overflow用户

提问于 2012-11-20 08:00:59

回答 1查看 1.8K关注 0票数 3

半监督学习使用一组标记数据(L)来训练一个模型来预测一组未标记数据(U)，然后将新的标记数据(L‘)和原始标记数据(L)分组为完整的标记数据。

我想问一下如何提取测试数据。

我应该从(L联合L')中提取测试数据
我应该从(L)中提取测试数据。

哪一个是对的？

如果从(L并L')提取测试数据，结果就没有意义，因为L‘中的答案可能是错误的.？

==========================================================编辑新

我有另一个主意..。

在开始时，我应该将标记数据(L)拆分为训练数据(L_train)和测试数据(L_test)。

然后使用L_train训练模型，并利用它预测一组未标记数据(U)，然后对预测结果(L‘)和L_train进行分组。

并使用L_train联合L‘来训练模型，在L_test上进行测试。

哪一个是对的1,2,3？谢谢你的回复。

testing

machine-learning

training-data

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-11-20 09:51:11

你用L训练你的分类器。您可以首先执行交叉验证以适应某些方法参数P。使用参数P，从标记的数据L构造模型M。然后使用模型M标记未标记的数据U。您可以将U中的示例(对分配的类最有信心)与L连接起来。然后重复这个过程，直到对所有示例进行分类。

-编辑-

我认为最合适的方法是第三种方法。但我可能不太明白，就这样吧。

您将L拆分为L_train和L_test。使用L_train对分类器进行培训，还可以使用此分类器对U进行分类(按照我前面描述的方法)。从标记U和L_train的结合出发，构造了一个新的分类器，并使用它对L_test进行分类。这些分类的差异可用于评价措施(分类的准确性，.)。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/13468848

复制

相似问题

问半监督学习测试数据
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问半监督学习测试数据EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问半监督学习测试数据
EN