文章/答案/技术大牛

发布

社区首页 >问答首页 >总结部分词的r函数？

问总结部分词的r函数？
EN

Stack Overflow用户

提问于 2021-09-02 07:41:59

回答 2查看 77关注 0票数 0

，我试图总结R中的“现代”一词，并对其进行统计。，问题是原始的excel文件具有与其他疫苗混合的值。正如你所看到的，我的原始R文件中有“现代”的单词，与'Oxford/Astrazeneca‘混在一起。

这是我的尝试，试图总结‘现代’在代码是低于。

代码如下：

Number_Of_Countries_Using_Moderna <- Number_of_Vaccines_used %>%
  group_by(vaccines) %>%
  summarize(Moderna_Countries=sum(n))

我会用group_by疫苗，以获得现代疫苗，然后尝试总结现代疫苗的数量(在这个过程中建立一个新的专栏)。问题是使用‘group_by(疫苗)功能’是不正确的。

你们有什么建议吗？谢谢你抽出时间:)

以下两种解决方案中的任何一种都解决了问题，谢谢。

回答 2

Stack Overflow用户

回答已采纳

发布于 2021-09-02 07:55:47

如果我的理解是正确的，那么每当n列中提到vaccines时，您都在试图得到vaccines的和？如果是这样的话，下面是一个解决方案。您需要“筛选”，而不是"group_by"：

Number_of_Vaccines_used %>%
  filter(grepl("Moderna", vaccines)) %>%
  summarize(Moderna_Countries = sum(n))

票数 1

Stack Overflow用户

发布于 2021-09-02 08:16:29

不完全是你想要的:如果你想要一份完整的疫苗清单及其数量，你可以用

library(dplyr)
library(tidyr)

Number_of_Vaccines_used %>%
  mutate(vaccines = strsplit(vaccines, ", ")) %>% 
  unnest(vaccines) %>% 
  group_by(vaccines) %>% 
  summarise(n = sum(n))

这导致了类似的结果

# A tibble: 10 x 2
   vaccines               n
   <chr>              <int>
 1 Covaxin                1
 2 EpiVacCorona           1
 3 Johnson&Johnson        2
 4 Moderna               35
 5 Oxford/AstraZeneca   105
 6 Pfizer/BioNTech       82
 7 Sinopharm/Beijing     24
 8 Sinopharm/Wuhan        2
 9 Sinovac               18
10 Sputnik V             20

数据

structure(list(vaccines = c("Covaxin, Oxford/AstraZeneca", "EpiVacCorona, Sputnik V", "Johnson&Johnson", "Johnson&Johnson, Moderna, Pfizer/BioNTech", "Moderna", "Moderna, Oxford/AstraZeneca"), n = c(1L, 1L, 1L, 1L, 1L, 1L)), row.names = c(NA, -6L), class = c("tbl_df", "tbl", "data.frame"))

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/69026065

复制

相似问题

问总结部分词的r函数？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问总结部分词的r函数？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问总结部分词的r函数？
EN