首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >匹配不同变量的子字符串

匹配不同变量的子字符串
EN

Stack Overflow用户
提问于 2019-09-10 17:51:16
回答 1查看 44关注 0票数 1

我有一个作者的数据,他们发表的论文和每篇论文的引文数(以及其他71篇专栏)。我想找出被引用最多的作家。问题是有些论文有多个作者,所以每个作者都是一个子字符串。我可以很容易地把作者分开,但我不知道如何汇总他们的每一篇引文。有人能帮忙吗?

这是数据

代码语言:javascript
复制
    year   citation  author              paper_title
    2018       33    author1; author2    paper1
    2018       89    author2; author3    paper2
    2017       10    author4             paper3 
    2013       10    author2             paper4
    2014        9    author3             paper5
    2011        1    author5             paper7
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-09-10 18:18:47

代码语言:javascript
复制
df <- data.frame(year = c(2018, 2017),
citation = c(33,89),
author = c('author1; author2', 'author2; author3'),
paper_title = c('paper1', 'paper2'), stringsAsFactors = F)

df <- df %>% mutate(author=strsplit(author, "; ")) %>% 
  unnest(author) %>% group_by(author) %>% summarise(n_cit = sum(citation))
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57875991

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档