我有一个问题,在那里,我想确定供应商与不同寻常的高金额发票。怎样才是识别此类发票的最佳方式?
我试图使用隔离森林,但在按供应商的结果分组方面有困难。
任何帮助都将不胜感激。
数据格式如下。
Vendor ID Amount
1 456
2 1000
1 489
3 896
2 4576发布于 2022-05-08 17:42:25
这是一个非常简单的例子,我不会依赖任何自动检测算法,直到我手动查看这些数据或历史数据,并根据某些业务定义将数据点标记为“不寻常”。一些超出规范的数据点实际上可能是有效的。根据您的示例,您只是没有足够的历史数据和额外的多元数据来确定。
https://datascience.stackexchange.com/questions/90927
复制相似问题