我知道半监督学习方法的存在,例如阶梯网络,其中只有一部分数据被标记。是否有任何方法或论文考虑训练数据子集标签的正确性概率?也就是说,一些标签可能是100%正确的,而另一些标签可能只有70%或45%的概率是正确的。任何链接到文件或在这方面的工作将受到高度赞赏。
发布于 2017-06-09 16:21:50
我不知道任何文件,如果有人联系一些,我会非常感激。
在我的例子中,我总是使用“传统”67% - 33% (列车测试)分割和检查标签在各种度量标准(准确性、日志丢失等)中的表现来测试我已经知道的标签数据。
此外,半监督学习的种类也很多.例如,如果您要使用主动学习(基于池的方法,每次都包括增量抽样/S),则可以查看性能范围。
最后,您也可以使用同样意义上的交叉验证来为您的半监督学习算法进行超参数调整。总之,在我看来,半监督学习还有很多东西要做,你的问题可能更多,具体数据和可视化数据和聚类可能会给你带来新的见解。
https://datascience.stackexchange.com/questions/19589
复制相似问题