我正在研究一个异常检测用例。我研究了一种将5%的验证数据标记为异常的阈值选择技术。在异常检测案例中是如何工作的。另外还有一种选择阈值的技术,它最大限度地提高了TPR和FPR之间的差异。
哪一种方法有助于无监督学习,并将其与实际情况进行比较。
用TP和FP率绘制RC曲线,可以找到理想的阈值。但是在没有监督的情况下,它是一种很好的技术。
发布于 2022-04-20 06:20:08
无监督意味着你没有任何标签数据。要知道真阳性率和假阳性率,你需要标签。在没有训练数据的情况下,无法计算RC曲线。
您可能是在讨论隔离林,它假定一定百分比的数据为异常,而该百分比是由用户定义的超参数。因此,您可以根据手头的业务用例选择1%或10%。
https://datascience.stackexchange.com/questions/110205
复制相似问题