半监督学习使用一组标记数据(L)来训练一个模型来预测一组未标记数据(U),然后将新的标记数据(L‘)和原始标记数据(L)分组为完整的标记数据。
我想问一下如何提取测试数据。
哪一个是对的?
如果从(L并L')提取测试数据,结果就没有意义,因为L‘中的答案可能是错误的.?
==========================================================编辑新
我有另一个主意..。
然后使用L_train训练模型,并利用它预测一组未标记数据(U),然后对预测结果(L‘)和L_train进行分组。
并使用L_train联合L‘来训练模型,在L_test上进行测试。
哪一个是对的1,2,3?谢谢你的回复。
发布于 2012-11-20 09:51:11
你用L训练你的分类器。您可以首先执行交叉验证以适应某些方法参数P。使用参数P,从标记的数据L构造模型M。然后使用模型M标记未标记的数据U。您可以将U中的示例(对分配的类最有信心)与L连接起来。然后重复这个过程,直到对所有示例进行分类。
-编辑-
我认为最合适的方法是第三种方法。但我可能不太明白,就这样吧。
您将L拆分为L_train和L_test。使用L_train对分类器进行培训,还可以使用此分类器对U进行分类(按照我前面描述的方法)。从标记U和L_train的结合出发,构造了一个新的分类器,并使用它对L_test进行分类。这些分类的差异可用于评价措施(分类的准确性,.)。
https://stackoverflow.com/questions/13468848
复制相似问题