我希望将所有的用户从一个特定列从1转到0的数据文件中获取。
例如,使用下面的dataframe,我希望只保留用户1和2,因为它们的值从1到0。
相关行
user value
0 0 0
1 0 0
2 0 1
3 0 1
4 1 0
5 1 1
6 1 1
7 1 0
8 2 1
9 2 1
10 2 0
11 2 0期望结果
user value
4 1 0
5 1 1
6 1 1
7 1 0
8 2 1
9 2 1
10 2 0
11 2 0我尝试过窗口函数和条件,但由于某些原因,我无法获得所需的结果。
发布于 2022-03-12 16:23:31
让我们试试cummax
df.loc[df.user.isin(df.loc[df.value != df.groupby('user')['value'].cummax(),'user'])]
Out[769]:
user value
4 1 0
5 1 1
6 1 1
7 1 0
8 2 1
9 2 1
10 2 0
11 2 0发布于 2022-03-12 16:22:55
您可以使用shift检查下一个值是否为1 (df.value.shift(1).eq(1)),并将其与掩码结合起来检查当前值是否为0 (df.value.eq(0))。然后,由'user'和transform('any')组成组以创建适当的掩码:
filtered = df[(df.value.eq(0) & df.value.shift(1).eq(1)).groupby(df.user).transform('any')]输出:
>>> filtered
user value
4 1 0
5 1 1
6 1 1
7 1 0
8 2 1
9 2 1
10 2 0
11 2 0发布于 2022-03-12 17:04:08
您可以使用GroupBy.filter。如果任何diff (连续值的差)等于-1 (0-1),则保留该组。
df.groupby('user').filter(lambda g: g['value'].diff().eq(-1).any())注意:这假设您只有0和1s,如果您可以有其他数字,您还需要使用两个条件:(g['value'].eq(1)&g['value'].shift(-1).eq(0)).any()
产出:
user value
4 1 0
5 1 1
6 1 1
7 1 0
8 2 1
9 2 1
10 2 0
11 2 0https://stackoverflow.com/questions/71451182
复制相似问题