使用表格数据进行回归任务的
发布于 2021-09-06 18:15:19
对于大多数半监督学习(SSL)来说,一个关键的假设是,附近的点(例如,在无标记点和标记点之间)很可能共享相同的标签。似乎您期望您的未标记集的方差和分布与您的标记集不同,这可能违反上述假设。
如果您仍然希望继续使用SSL,那么就没有用于回归方法的传统技术。但是..。
关于非常规方法的文献已被综述:https://www.researchgate.net/publication/325798856_Semi-supervised_regression_A_recent_review。
还有..。
您可以始终转换为分类方法(如果标签是相对均匀分布的,则会有所帮助)。例如,只需在标记集中选择中值预测值,则所有小于该值的值都为0,而所有的值都大于1。然后,您可以应用传统的分类SSL技术,例如标签传播。然后,得到测试集上的预测概率(例如,使用predict_proba()),并将这些概率缩小到您的回归范围。例如,如果标记集中的最小值为0,最大值为10,则只需将预测的概率乘以10。
希望以上所述至少能提供思考的食粮。
https://stackoverflow.com/questions/60107479
复制相似问题