我正在为机器学习准备一些数据。这个问题很容易回答,但我有点困惑。
假设系统每1小时有大约100次报警,而只有1或2次警报才是真正的警报。假警报会被人忽略。我收集了一些看起来像特征的数据,并给出了标签0或1来伪造或真正的警报。
在这种情况下,真正的警报是0还是1?由此可改变TP、TN、FP、FN、机会水平。我们感兴趣的是真正的警报,我们不想错过它,即使所有的警报都是人工检查的。
几乎警报是假的,所以概率水平将超过95%。那么大班和正面班会是1级假警报吗?但我们的兴趣不是假警报。在这种情况下,我该如何设置标签?
发布于 2018-08-04 00:44:40
这两种方法对模型的性能都是一样的,因为损失函数不受标记1或0的方式的影响。就我个人而言,我认为0应该用于伪造的,1用于真实的。
https://stackoverflow.com/questions/51681353
复制相似问题