首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >标记作为异常检测中的特征

标记作为异常检测中的特征
EN

Data Science用户
提问于 2020-12-01 00:46:00
回答 1查看 58关注 0票数 1

我有一个数据集来解决分类问题。由于Y的不平衡,我选择转移到异常检测任务。我应该使用异常检测模型中的Y作为特征吗?这是一种过度适应的风险吗?

EN

回答 1

Data Science用户

发布于 2020-12-01 23:09:54

这仅仅取决于任务的目标是什么:

  • 如果最终的目标仍然是在发现异常后预测Y(即可能使用异常检测的输出作为特征),那么Y就不能使用,因为它在实际的测试集中是不可用的。
  • 如果它只是一个完全不同的任务,其中Y是可用的输入,那么为什么不使用它。

对于500 k实例,一个包含3个可能值的附加变量有极低的导致过度拟合的风险。

注意,由于分类不起作用,特征与Y之间很可能没有什么关系(否则分类实验中会出现一些错误)。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/86146

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档