在我的毕业设计中,我想删除重复的行,只保留b和c列与a列中值相等的一行。我尝试了很多事情,群比,合并组合和重复,但是直到现在还没有结果。你能帮帮我吗?非常感谢!
投入:
a b c
0 1 A B
1 1 A A
2 1 A C
3 2 B A
4 2 B B结果:
a b c
1 1 A A
4 2 B B发布于 2018-03-07 14:20:45
我相信你需要:
print (df)
a b c
0 1 A B
1 1 A A
2 1 A C
3 2 B A
4 2 B B
5 3 C C
6 4 C NaN
7 4 C E
7 5 NaN E将NaNs替换为正向和反向填充:
df1 = df[['b','c']].bfill(axis=1).ffill(axis=1)
print (df1)
b c
0 A B
1 A A
2 A C
3 B A
4 B B
5 C C
6 C C
7 C E
7 E E检查df1中的条件,因为相同的索引可能是筛选器df
df = df[df1['b'] == df1['c']]
print (df)
a b c
1 1 A A
4 2 B B
5 3 C C
6 4 C NaN
7 5 NaN Ehttps://stackoverflow.com/questions/49154098
复制相似问题