首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >处理重复条目

处理重复条目
EN

Stack Overflow用户
提问于 2022-04-04 11:29:14
回答 1查看 41关注 0票数 0

如果记录是重复的,我想将给定的记录重新分配到一个组。在下面的数据集中,我希望12-4都分配给组A或B,但不是两者兼而有之。有什么办法吗?

代码语言:javascript
复制
library(tidyverse)

dat <- tibble(
  group = c("A", "A", "A", "A", "B", "B", "B", "B", "B"),
  assigned = c("12-1", "12-2", "12-3", "12-4", "12-4", "12-5", "12-6",
               "12-7", "12-8")
)

# Attempts to tease out records for each group
dat %>% pivot_wider(names_from = group, values_from = assigned)
EN

回答 1

Stack Overflow用户

发布于 2022-04-04 11:53:33

您可以按记录分组并将所有组重新分配到同一组中,从可用组中随机选择:

代码语言:javascript
复制
dat %>%
  group_by(assigned) %>%
  mutate(group = nth(group, sample(n())[1])) %>%
  ungroup()

#> # A tibble: 9 x 2
#>   group assigned
#>   <chr> <chr>   
#> 1 A     12-1    
#> 2 A     12-2    
#> 3 A     12-3    
#> 4 A     12-4    
#> 5 A     12-4    
#> 6 B     12-5    
#> 7 B     12-6    
#> 8 B     12-7    
#> 9 B     12-8
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71736508

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档