首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >RTextTools:理解“algorithm_summary”

RTextTools:理解“algorithm_summary”
EN

Stack Overflow用户
提问于 2017-01-10 18:33:34
回答 1查看 131关注 0票数 1

我试图理解RTextTools是如何提供一套很好的文档分类功能的。

但是,在运行内置数据集时,我无法理解如何解释下表。(我想知道为什么有10行)

代码语言:javascript
复制
        SVM_PRECISION   SVM_RECALL  SVM_FSCORE  MAXENTROPY_PRECISION    MAXENTROPY_RECALL   MAXENTROPY_FSCORE
2           NaN             0               NaN                     0.5                 1               0.67    
12          NaN             0               NaN                     0                   0               NaN
14          NaN             0               NaN                     NaN                 0               NaN
15          NaN             0               NaN                     0                   0               NaN
16          NaN             0               NaN                     0.33                0.2             0.25
17          NaN             0               NaN                     NaN                 0               NaN
19         0.08         1               0.15                    0.14                0.5             0.22
20          NaN             0               NaN                     0.38                0.75            0.5
24          NaN             0               NaN                     NaN                 0               NaN
31          NaN             0               NaN                     NaN                 0               NaN

上面的表格可以生成为

代码语言:javascript
复制
library(RTextTools)
data(NYTimes)
data <- NYTimes[sample(1:3100,size=100,replace=FALSE),]
matrix <- create_matrix(cbind(data["Title"],data["Subject"]), language="english", 
                        removeNumbers=TRUE, stemWords=FALSE, weighting=tm::weightTfIdf)
container <- create_container(matrix,data$Topic.Code,trainSize=1:75, testSize=76:100, 
                              virgin=FALSE)
models <- train_models(container, algorithms=c("MAXENT","SVM"))
results <- classify_models(container, models)
analytics <- create_analytics(container, results)
summary(analytics)
alg_summary <- analytics@algorithm_summary
EN

回答 1

Stack Overflow用户

发布于 2017-05-30 21:13:38

docs

“data.frame”类的

algorithm_summary对象:存储每个算法的精度、召回率和F-score统计信息,按标签分解

在完整的NYTimes数据集中有27个不同的主题代码,您的示例可能包含其中的10个。因此有10行。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41566702

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档