文章/答案/技术大牛

发布

社区首页 >问答首页 >与unnest_tokens相反

问与unnest_tokens相反
EN

Stack Overflow用户

提问于 2017-10-13 16:44:37

回答 1查看 3.3K关注 0票数 10

这很可能是一个愚蠢的问题，但我已经搜索和谷歌，并没有找到解决办法。我想是因为我不知道该怎么回答我的问题。

我有一个数据框架，我已经转换成整洁的文本格式的R，以消除停止词。我现在想把这个数据框架‘弄乱’回到原来的格式。

unnest_tokens的相反/逆命令是什么？

编辑:下面是我正在处理的数据。我试图复制西尔奇和罗宾逊的整齐的文本书的分析，但使用意大利歌剧歌词。

character = c("FIGARO", "SUSANNA", "CONTE", "CHERUBINO") 
line = c("Cinque... dieci.... venti... trenta... trentasei...quarantatre", "Ora sì ch'io son contenta; sembra fatto inver per me. Guarda un po', mio caro Figaro, guarda adesso il mio cappello.", "Susanna, mi sembri agitata e confusa.", "Il Conte ieri perché trovommi sol con Barbarina, il congedo mi diede; e se la Contessina, la mia bella comare, grazia non m'intercede, io vado via, io non ti vedo più, Susanna mia!") 
sample_df = data.frame(character, line)
sample_df

character line
FIGARO    Cinque... dieci.... venti... trenta... trentasei...quarantatre
SUSANNA   Ora sì ch'io son contenta; sembra fatto inver per me. Guarda un po', mio caro Figaro, guarda adesso il mio cappello.
CONTE     Susanna, mi sembri agitata e confusa.
CHERUBINO Il Conte ieri perché trovommi sol con Barbarina, il congedo mi diede; e se la Contessina, la mia bella comare, grazia non m'intercede, io vado via, io non ti vedo più, Susanna mia!

我把它变成整洁的文字，这样我就可以去掉停止词：

tribble <- sample_df %>%
           unnest_tokens(word, line)
# Get rid of stop words
# I had to make my own list of stop words for 18th century Italian opera
itstopwords <- data_frame(text=mystopwords)
names(itstopwords)[names(itstopwords)=="text"] <- "word"
tribble2 <- tribble %>%
            anti_join(itstopwords)

现在我有了这样的东西：

text    word
FIGARO  cinque
FIGARO  dieci
FIGARO  venti
FIGARO  trenta
...

我想让它回到字符名称的格式和相关的行，看看其他的东西。基本上，我希望文本以相同的格式，它是以前，但与停止字删除。

tidyr

tidyverse

tidytext

回答 1

Stack Overflow用户

发布于 2018-06-20 23:23:11

library(tidyverse)
tidy_austen %>% 
     group_by(book,linenumber) %>% 
     summarise(text = str_c(word, collapse = " "))

票数 8

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/46734501

复制

相似问题

问与unnest_tokens相反
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问与unnest_tokens相反EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问与unnest_tokens相反
EN