非常新的R,并已开始使用tidytext包。
我试图使用参数来输入unnest_tokens函数,这样我就可以进行多列分析。所以,而不是这个
library(janeaustenr)
library(tidytext)
library(dplyr)
library(stringr)
original_books <- austen_books() %>%
group_by(book) %>%
mutate(linenumber = row_number(),
chapter = cumsum(str_detect(text, regex("^chapter [\\divxlc]",
ignore_case = TRUE)))) %>%
ungroup()
original_books
tidy_books <- original_books %>%
unnest_tokens(word, text)最后一行代码是:
output<- 'word'
input<- 'text'
tidy_books <- original_books %>%
unnest_tokens(output, input)但我明白了:
check_input(x)中的错误:输入必须是任意长度的字符向量或字符向量列表,每个字符向量的长度为1。
我尝试过使用as.character(),但没有太多的运气。
对这是怎么回事有什么想法?
发布于 2016-08-30 05:38:37
试一试
tidy_books <- original_books %>%
unnest_tokens_(output, input)在unnest_tokens_中使用下划线。
unnest_tokens_是unnest_tokens的“标准计算”版本,允许您将变量名称作为字符串传递。有关标准和非标准评估的讨论,请参见非标准评价。
发布于 2020-08-26 05:53:55
我也有同样的问题。我通过指定输入来解决这个问题,如下所示:
unnest_tokens(input = "events", token = "words", "word")与“事件”实际上是我的列名。
https://stackoverflow.com/questions/39217789
复制相似问题