我会使用Benoit的R软件包quanteda来分析从lexisnexis导出的文章。导出采用标准的html格式。我使用tm包+插件读取lexisnexis输出。不幸的是,当tm-语料库转换为quanteda语料库时会发生错误.这个功能坏了吗,还是我以前出了什么问题?
library("tm")
library("tm.plugin.lexisnexis")
library("quanteda")
ln <- LexisNexisSource("lexisnexisOutput.html")
cr <- Corpus(ln)
crp <- corpus(cr)
Error in UseMethod("corpus") :
no applicable method for 'corpus' applied to an object of class "list"
In addition: Warning message:
In corpus(texts, docvars = metad, source = paste("Converted from tm VCorpus '", :
Arguments docvarssource not used.发布于 2015-12-28 09:33:46
当文本是字符类型的向量时,这是corpus.VCorpus()的一个限制,而不仅仅是单个字符类型。固定在数量0.9.1-6。见关于GitHub的第80号问题。
https://stackoverflow.com/questions/34165970
复制相似问题