首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >R中的Quanteda问题

R中的Quanteda问题
EN

Stack Overflow用户
提问于 2018-05-30 22:20:38
回答 1查看 84关注 0票数 0

我在R中使用Quanteda,并创建了语料库和dfm。但是,我注意到dfm和语料库包含的文档比原始文件少。如果有人能让我知道为什么会发生这种情况以及如何修复,我将不胜感激。谢谢

EN

回答 1

Stack Overflow用户

发布于 2019-01-31 19:50:12

您可以尝试像这样明确地提到docid_fieldtext_field

代码语言:javascript
复制
data_corpus = corpus(x = data,docid_field = "doc_id", text_field = "text")

其中doc_idtext是数据帧data中的列。

然后利用qunateda软件包中的dfm函数计算文档特征矩阵

代码语言:javascript
复制
data_dfm = dfm(data_corpus)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50607103

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档