我正在使用docs/python/tf/estimator/DNNClassifier
假设我有分类问题。试图对两件事进行分类。Class1是快乐的脸,Class2不是快乐的脸。在这个特殊的场景中,当我每天查看1,000+样本时,我只想抓住前10位快乐面孔。所以说真的,我只想对前十名的面孔都是快乐面孔充满信心。所以如果它把一张快乐的脸归类为不快乐的脸,我会同意的。它可能会错过一些(或者非常诚实地说,它每天会复习1000多个中的100个)。然而,如果它错误地将不快乐的脸归类为快乐的脸.我不会对结果感到满意。
所以我们可以说:好= TP =(真)快乐脸,(预测)快乐脸坏= FP =(真)不开心脸,(预测)快乐脸好= TN =(真)不开心脸,(预测)不开心脸OK = FN =(真)开心脸,(预测)不开心脸
差不多,我可以忍受偶尔的FN (假阴性)。但我真的不想要FP (假阳性)
我感兴趣的是使用重量栏来“减肥”所有的一个类,和“超重”的另一个类。
最后,我想要某种有偏的损失/成本函数。在培训时,FP应该“花费”更多,FN,仍然应该花费,但要少一点。从DNNClassifier的角度来看,weight_column似乎是答案。
在培训时,我可以将所有的快乐脸设置为1.5+的重量(或者其他什么,需要进行实验)。我可以把所有不开心的脸都设为0.5 (或者其他什么)。
所以,这可以归结为几个问题:
谢谢你的帮助。我很感激。
发布于 2018-01-29 17:23:56
我认为使用门限是处理FN和FP交易的更好方法。你可以这样做:
probability_of_1 = predictions from estimator
if probability_of_1 > YOUR_THRESHOLD:
output = happy-face
else:
output = not-happy-facehttps://stackoverflow.com/questions/48460913
复制相似问题