我的代码中有下面一行代码,其中我根据一个列Package对df进行分组,并根据另一个列Id上的条件计算每个组的大小。
df.groupby("Package")["Id"].apply(lambda x: x.isin(someList).sum())
Package
P1 1
P2 12
P3 52
P4 123
P5 5421
P6 53
P7 64
Name: Id, dtype: int64我的问题是,我还需要计算x不在someList中的每个组的大小。我该怎么做呢?我是不是应该在某个地方加个波浪号?
发布于 2021-06-03 18:31:17
在您的解决方案中,将带括号的~添加到lambda函数中:
df.groupby("Package")["Id"].apply(lambda x: (~x.isin(someList)).sum())或者使用语法糖-创建not成员的Series并按系列df["Package"]聚合
(~df["Id"].isin(someList)).groupby(df["Package"]).sum()与使用掩码填充的列Id类似的更清晰的想法,因此可以使用列名进行聚合:
df.assign(Id = ~df["Id"].isin(someList)).groupby("Package")["Id"].sum()https://stackoverflow.com/questions/67819784
复制相似问题