我正在尝试理解MAXent的classifier.show_most_informative_features(10)分类器。我不理解这些列的含义,例如在以下输出中:
train on 460 instances, test on 154 instances accuracy: 0.61038961039
pos precision: 0.432989690722
pos recall: 0.893617021277
neg precision: 0.912280701754
neg recall: 0.485981308411
-4.141 need==True and label is 'REL'
3.395 approves==True and label is 'IRREL' -
3.308 took==True and label is 'IRREL'
-1.766 treat==True and label is 'REL'
-1.488 tired==True and label is 'IRREL'
-1.295 gave==True and label is 'IRREL'
0.879 need==True and label is 'IRREL' 发布于 2013-05-01 07:08:30
看起来您有两个标签,"RELEVANT"和"IRRELEVANT"。当有两个标签时,一个标签通常被命名为"1“或正标签,另一个标签被命名为"-1”或负标签。
在训练过程中,分类器分析了460个训练实例的特征,并根据它们区分两个标签的能力对它们进行加权。加权过程的详细信息取决于您选择的算法。
正值精度:在测试过程中被归类为标签1的154个测试实例中, 43 %的实例真正具有标签1。
正召回:在测试集中找到了89%的label 1实例,即被分类为label 1。
负精度/负召回相同,但对于label -1。
准确性: 154个测试实例中有61%的标记正确。
根据其绝对值对特征进行排序,该绝对值对应于它们与分类的相关性。在这种情况下,最“有用”的特性是need,如果这是真的,这是一个很好的提示,即实例的标签应该是“相关的”。
https://stackoverflow.com/questions/16266842
复制相似问题