首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >表格数据回归任务的半监督学习?

表格数据回归任务的半监督学习?
EN

Stack Overflow用户
提问于 2020-02-07 05:17:43
回答 1查看 249关注 0票数 0

使用表格数据进行回归任务的

  • Semi-supervised学习?我有20 K标签数据和200 K未标记数据。
  • 模型在半监督学习的基础上得到了越来越好的应用。自我学习,最重要的是,如果你只有20K,并且对200K做出预测,你就会假设方差和特征的分布是一样的,这并不总是正确的,所以你做一个误差很大的预测,即使你的模型在K折叠CV上是90平均R2。希望这解释了为什么我要寻找一种半监督的回归方法
EN

回答 1

Stack Overflow用户

发布于 2021-09-06 18:15:19

对于大多数半监督学习(SSL)来说,一个关键的假设是,附近的点(例如,在无标记点和标记点之间)很可能共享相同的标签。似乎您期望您的未标记集的方差和分布与您的标记集不同,这可能违反上述假设。

如果您仍然希望继续使用SSL,那么就没有用于回归方法的传统技术。但是..。

关于非常规方法的文献已被综述:https://www.researchgate.net/publication/325798856_Semi-supervised_regression_A_recent_review

还有..。

您可以始终转换为分类方法(如果标签是相对均匀分布的,则会有所帮助)。例如,只需在标记集中选择中值预测值,则所有小于该值的值都为0,而所有的值都大于1。然后,您可以应用传统的分类SSL技术,例如标签传播。然后,得到测试集上的预测概率(例如,使用predict_proba()),并将这些概率缩小到您的回归范围。例如,如果标记集中的最小值为0,最大值为10,则只需将预测的概率乘以10。

希望以上所述至少能提供思考的食粮。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60107479

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档