首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >大熊猫GroupBy唯一聚集性及特定条件

大熊猫GroupBy唯一聚集性及特定条件
EN

Stack Overflow用户
提问于 2020-02-14 08:00:30
回答 1查看 162关注 0票数 1

我有一个数据文件,如下所示

代码语言:javascript
复制
UnitID    Sector    Start_Date      Status
1         SE1       2018-02-26      Closed
1         SE1       2019-03-27      Active
2         SE1       2017-02-26      Closed
2         SE1       2018-02-26      Closed
2         SE1       2019-02-26      Active
3         SE1       NaT             Not_in_contract
4         SE1       NaT             Not_in_contract
5         SE2       2017-02-26      Closed
5         SE2       2018-02-26      Closed
5         SE2       2019-02-26      Active
6         SE2       2018-02-26      Closed
6         SE2       2019-02-26      Active
7         SE2       2018-02-26      Closed
7         SE2       2018-07-15      Closed
8         SE2       NaT             Not_in_contract
9         SE2       NaT             Not_in_contract
10        SE2       2019-05-22      Active
11        SE2       2019-06-24      Active

从上面我想准备下面的数据框架。

代码语言:javascript
复制
Sector      Number_of_unique_units     Number_of_Active_units
SE1         4                          2
SE2         7                          4
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-02-14 08:05:46

使用GroupBy.aggDataFrameGroupBy.nunique和自定义lambda函数,并使用布尔掩码的sumActive计数数:

代码语言:javascript
复制
df1=(df.groupby('Sector').agg(Number_of_unique_units=('UnitID','nunique'),
                              Number_of_Active_units=('Status',lambda x:x.eq('Active').sum()))
                         .reset_index())
print (df1)
  Sector  Number_of_unique_units  Number_of_Active_units
0    SE1                       4                       2
1    SE2                       7                       4
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60222215

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档