首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何:在“topicmodels”中检查术语文档矩阵中的频率权重

如何:在“topicmodels”中检查术语文档矩阵中的频率权重
EN

Stack Overflow用户
提问于 2013-02-05 06:50:20
回答 1查看 3.2K关注 0票数 3

我正在尝试使用R包topicmodels进行一些主题建模

根据这些说明R text file and text mining...how to load data,我已经使用'tm‘包进行了预处理。

但是,当我在R中使用topicmodels运行我的相关主题模型(CTM)时,我收到以下错误

代码语言:javascript
复制
 "Error in CTM...DocumentTermMatrix needs to have a term frequency weighting. 

我已经三次检查了我的DocumentTermMatrix的结构,显示它确实有一个频率权重:

代码语言:javascript
复制
 A document-term matrix (26 documents, 413 terms)

 Non-/sparse entries: 4804/5934
 Sparsity           : 55%
 Maximal term length: 13 
 Weighting          : term frequency - inverse document frequency (normalized) (tf-idf)

任何关于如何让这个工作的建议都将不胜感激!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-05-06 17:35:46

如果您之前使用的是slam包,则需要将加权参数指定为weightTf:

代码语言:javascript
复制
m=as.simple_triplet_matrix(mm);
dtm <- as.DocumentTermMatrix(m,weighting =weightTf)
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/14697218

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档