对于下面的数据帧,
date1 date2 userid
2020-10-20 2020-10-22 101
2020-09-10 2020-10-11 101
2020-10-20 2020-10-23 101
2020-12-05 2020-12-06 102
2020-12-04 2020-12-06 102我可以像这样得到输出吗?
date1 date2 userid
2020-10-20 2020-10-22 101
2020-09-10 2020-10-11 101
2020-12-05 2020-12-06 102date1和date2的关系应该是1:1,反之亦然。
发布于 2021-01-05 21:11:49
您可以按每列分组,并获取第一项:
data_string = io.StringIO('''date1 date2 userid
2020-10-20 2020-10-22 101
2020-09-10 2020-10-11 101
2020-10-20 2020-10-23 101
2020-12-05 2020-12-06 102
2020-12-04 2020-12-06 102''')
df = pd.read_csv(data_string,sep=r'\s+')
df = df.groupby(['date2'],as_index=False).first()
df = df.groupby(['date1'],as_index=False).first()
df
>>>
date1 date2 userid
0 2020-09-10 2020-10-11 101
1 2020-10-20 2020-10-22 101
2 2020-12-05 2020-12-06 102请注意,此数据帧最终排序为
https://stackoverflow.com/questions/65579368
复制相似问题