如何使用text2vec包创建一个具有字符n-gram特性的tdf-idf矩阵?
发布于 2018-03-19 13:14:34
不如:
library(text2vec)
data("movie_review")
it = itoken(movie_review$review, tolower, char_tokenizer)
v = create_vocabulary(it, ngram = c(3, 3), sep_ngram = "_")
dtm = create_dtm(it, vectorizer = vocab_vectorizer(v))在未来的PS,请尝试提供一些可重复的例子,你试图解决你的问题。
https://stackoverflow.com/questions/49359513
复制相似问题