文章/答案/技术大牛

发布

社区首页 >问答首页 >斯坦福分类器交叉验证平均或聚合度量

问斯坦福分类器交叉验证平均或聚合度量
EN

Stack Overflow用户

提问于 2016-04-01 16:28:48

回答 1查看 378关注 0票数 1

使用斯坦福分类器，可以通过在属性文件中设置选项来使用交叉验证，例如，这用于10倍交叉验证：

crossValidationFolds=10
printCrossValidationDecisions=true
shuffleTrainingData=true
shuffleSeed=1

运行这将输出，每倍，各种指标，如精度，召回，准确性/微观平均F1和宏观平均F1。

作为输出的一部分，是否有办法获得所有10个精度/微观平均F1或全部10个宏平均F1的平均或其他合计分数？

在Weka中，默认情况下，经过10倍交叉验证后的输出包括所有折叠的平均度量。斯坦福分类器中也有这样的选项吗？拥有最终的精确性，召回或F1评分可用，并优化参数，如在Weka，是非常有用的，我想这样做斯坦福分类器。多么?

nlp

weka

stanford-nlp

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-04-03 09:03:51

当我以10倍的速度运行时，我看到了输出。当我运行这个命令时：

java -cp "*" edu.stanford.nlp.classify.ColumnDataClassifier -prop examples/cheese2007.prop -crossValidationFolds 10

我在输出中看到了这一点(在###折叠9之后)

[main] INFO edu.stanford.nlp.classify.ColumnDataClassifier - 181 examples in test set
[main] INFO edu.stanford.nlp.classify.ColumnDataClassifier - Cls 2: TP=109 FN=6 FP=7 TN=59; Acc 0.928 P 0.940 R 0.948 F1 0.944
[main] INFO edu.stanford.nlp.classify.ColumnDataClassifier - Cls 1: TP=59 FN=7 FP=6 TN=109; Acc 0.928 P 0.908 R 0.894 F1 0.901
[main] INFO edu.stanford.nlp.classify.ColumnDataClassifier - Accuracy/micro-averaged F1: 0.92818
[main] INFO edu.stanford.nlp.classify.ColumnDataClassifier - Macro-averaged F1: 0.92224 
[main] INFO edu.stanford.nlp.classify.ColumnDataClassifier - Average accuracy/micro-averaged F1: 0.93429
[main] INFO edu.stanford.nlp.classify.ColumnDataClassifier - Average macro-averaged F1: 0.92247

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/36361348

复制

相似问题

问斯坦福分类器交叉验证平均或聚合度量
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问斯坦福分类器交叉验证平均或聚合度量EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问斯坦福分类器交叉验证平均或聚合度量
EN