我想知道什么时候停止半监督?例如,如果我从一个小数据集中学习了一个分类器,然后使用它来标记一个未标记的数据集池。然后,我再次使用新标记的数据来训练分类器。这一进程应持续多长时间?
发布于 2019-05-02 08:51:37
大多数半监督的方法都是启发式的,或多或少是对标准监督学习算法的修改,在这种方法中,考虑到一个小的标记数据集,你试图考虑未标记的数据。如果来自这两个数据集的数据不遵循相同的分布,那么您必须寻找转移学习方法。
我猜你是在为半监督学习的迭代方法/方法要求一个停止准则,否则你不需要一个停止准则。这取决于方法。您可以定义一个阈值,以反映对未标记数据能够被正确标记的信心,并将它们与已经标记的实例用作伪标记实例,以训练准确的分类器。另一个选项可以是定义最大的迭代次数。
https://datascience.stackexchange.com/questions/51261
复制相似问题