对于使用自动编码器进行异常检测/新颖性检测,我有一个关于特征规范化/标准化(Standardisation)的问题。通常,在ML问题中,我们分割火车/测试集。在列车上安装普通/标准定标器,并使用它来转换(而不是fit_transform )测试数据。但是,在异常检测/新颖性检测中,我们如何使用“正常”数据(而不是“异常”)来训练异常检测器?这里的训练数据不代表测试数据,因为它只学习“正常”数据,以便在给定“异常”数据时产生重建误差。在这里,我们是否应该对列车数据进行规范化处理,并利用它来转换异常?我认为这是不恰当的。如果训练数据和测试数据分别产生解释性的结果,它可以单独进行缩放吗?
发布于 2022-10-31 12:53:46
您的测试集应该同时包含正常和异常数据点,并且“正常”点必须类似于您的培训数据。所以你在训练数据上进行缩放/正常化,就像正常情况一样。
https://stackoverflow.com/questions/74258522
复制相似问题