我有一个数据集来解决分类问题。由于Y的不平衡,我选择转移到异常检测任务。我应该使用异常检测模型中的Y作为特征吗?这是一种过度适应的风险吗?
发布于 2020-12-01 23:09:54
这仅仅取决于任务的目标是什么:
对于500 k实例,一个包含3个可能值的附加变量有极低的导致过度拟合的风险。
注意,由于分类不起作用,特征与Y之间很可能没有什么关系(否则分类实验中会出现一些错误)。
https://datascience.stackexchange.com/questions/86146
复制相似问题