首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >R Tidytext与unnest_tokens错误

R Tidytext与unnest_tokens错误
EN

Stack Overflow用户
提问于 2016-08-30 02:13:27
回答 2查看 10.8K关注 0票数 4

非常新的R,并已开始使用tidytext包。

我试图使用参数来输入unnest_tokens函数,这样我就可以进行多列分析。所以,而不是这个

代码语言:javascript
复制
library(janeaustenr)
library(tidytext)
library(dplyr)
library(stringr)

original_books <- austen_books() %>%
  group_by(book) %>%
  mutate(linenumber = row_number(),
         chapter = cumsum(str_detect(text, regex("^chapter [\\divxlc]",
                                                 ignore_case = TRUE)))) %>%
  ungroup()

original_books

tidy_books <- original_books %>%
              unnest_tokens(word, text)

最后一行代码是:

代码语言:javascript
复制
output<- 'word'
input<- 'text'

tidy_books <- original_books %>%
              unnest_tokens(output, input)

但我明白了:

check_input(x)中的错误:输入必须是任意长度的字符向量或字符向量列表,每个字符向量的长度为1。

我尝试过使用as.character(),但没有太多的运气。

对这是怎么回事有什么想法?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2016-08-30 05:38:37

试一试

代码语言:javascript
复制
tidy_books <- original_books %>% 
              unnest_tokens_(output, input)

unnest_tokens_中使用下划线。

unnest_tokens_unnest_tokens的“标准计算”版本,允许您将变量名称作为字符串传递。有关标准和非标准评估的讨论,请参见非标准评价

票数 5
EN

Stack Overflow用户

发布于 2020-08-26 05:53:55

我也有同样的问题。我通过指定输入来解决这个问题,如下所示:

代码语言:javascript
复制
unnest_tokens(input = "events", token = "words", "word")

与“事件”实际上是我的列名。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/39217789

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档