我有一个类似下面的数据框架。
df = expand.grid(A = c('a', 'b', 'c', 'd'),
B = c('a', 'b', 'c', 'd'))
A B
a a
b a
c a
d a
a b
b b
c b
d b
a c
b c我需要做的是根据两个列值的组合来删除重复项。例如,当row1是'a','b',而row2是'b‘,'a’。它们被认为是重复的。我需要移除其中一个。删除两列的重复项很容易。但在这种情况下,我如何根据它们的组合删除重复项?我想不出是怎么回事。在此之前非常感谢。
发布于 2018-05-01 21:42:25
您可以在apply sort中使用duplicated
df[!duplicated(data.frame(t(apply(df,1,sort)))),]
A B
1 a a
3 c a
5 a b
7 c b
9 a c
11 c c
13 a d
15 c dhttps://stackoverflow.com/questions/50117441
复制相似问题