文章/答案/技术大牛

发布

社区首页 >问答首页 >表格数据回归任务的半监督学习？

问表格数据回归任务的半监督学习？
EN

Stack Overflow用户

提问于 2020-02-07 05:17:43

回答 1查看 249关注 0票数 0

使用表格数据进行回归任务的

Semi-supervised学习？我有20 K标签数据和200 K未标记数据。
模型在半监督学习的基础上得到了越来越好的应用。自我学习，最重要的是，如果你只有20K，并且对200K做出预测，你就会假设方差和特征的分布是一样的，这并不总是正确的，所以你做一个误差很大的预测，即使你的模型在K折叠CV上是90平均R2。希望这解释了为什么我要寻找一种半监督的回归方法

machine-learning

regression

data-science

tabular

non-linear-regression

回答 1

Stack Overflow用户

发布于 2021-09-06 18:15:19

对于大多数半监督学习(SSL)来说，一个关键的假设是，附近的点(例如，在无标记点和标记点之间)很可能共享相同的标签。似乎您期望您的未标记集的方差和分布与您的标记集不同，这可能违反上述假设。

如果您仍然希望继续使用SSL，那么就没有用于回归方法的传统技术。但是..。

关于非常规方法的文献已被综述：https://www.researchgate.net/publication/325798856_Semi-supervised_regression_A_recent_review。

还有..。

您可以始终转换为分类方法(如果标签是相对均匀分布的，则会有所帮助)。例如，只需在标记集中选择中值预测值，则所有小于该值的值都为0，而所有的值都大于1。然后，您可以应用传统的分类SSL技术，例如标签传播。然后，得到测试集上的预测概率(例如，使用predict_proba())，并将这些概率缩小到您的回归范围。例如，如果标记集中的最小值为0，最大值为10，则只需将预测的概率乘以10。

希望以上所述至少能提供思考的食粮。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/60107479

复制

相似问题

问表格数据回归任务的半监督学习？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问表格数据回归任务的半监督学习？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问表格数据回归任务的半监督学习？
EN