假设我有一个熊猫数据帧,它是这样的:
df=
A B 6 2
A C 4 2
D F 9 3
K L 8 9
A B 4 3
D F 8 2我怎么能说,如果列A和B有重复项,删除具有最大列C的列?
例如,我们可以看到第1行和第5行具有相同的列A和B。
A B 6 2 (Line 1)
A B 4 3 (Line 5)我想删除第1行,因为6大于4。
所以我的输出应该是
A C 4 2
K L 8 9
A B 4 3
D F 8 2发布于 2019-07-28 23:17:29
尝试使用pd.sort_values按降序对需要查找最大值的列进行排序
然后使用pd.drop_duplicate进行drop_duplicates
df.sort_values(by=['C'],ascending=[True],inplace=True)
df.drop_duplicates(subset=['A','B'],inplace=True)https://stackoverflow.com/questions/57242167
复制相似问题