首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >MAXent分类器NLTK输出理解

MAXent分类器NLTK输出理解
EN

Stack Overflow用户
提问于 2013-04-29 03:26:23
回答 1查看 1K关注 0票数 2

我正在尝试理解MAXent的classifier.show_most_informative_features(10)分类器。我不理解这些列的含义,例如在以下输出中:

代码语言:javascript
复制
train on 460 instances, test on 154 instances accuracy: 0.61038961039 
pos precision: 0.432989690722 
pos recall: 0.893617021277 
neg precision: 0.912280701754 
neg recall: 0.485981308411    
-4.141 need==True and label is 'REL'    
3.395 approves==True and label is 'IRREL'   -
3.308 took==True and label is 'IRREL' 
-1.766 treat==True and label is 'REL' 
-1.488 tired==True and label is 'IRREL' 
-1.295 gave==True and label is 'IRREL' 
0.879 need==True and label is 'IRREL' 
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-05-01 07:08:30

看起来您有两个标签,"RELEVANT""IRRELEVANT"。当有两个标签时,一个标签通常被命名为"1“或正标签,另一个标签被命名为"-1”或负标签。

在训练过程中,分类器分析了460个训练实例的特征,并根据它们区分两个标签的能力对它们进行加权。加权过程的详细信息取决于您选择的算法。

正值精度:在测试过程中被归类为标签1的154个测试实例中, 43 %的实例真正具有标签1。

正召回:在测试集中找到了89%的label 1实例,即被分类为label 1。

负精度/负召回相同,但对于label -1。

准确性: 154个测试实例中有61%的标记正确。

根据其绝对值对特征进行排序,该绝对值对应于它们与分类的相关性。在这种情况下,最“有用”的特性是need,如果这是真的,这是一个很好的提示,即实例的标签应该是“相关的”。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/16266842

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档