文章/答案/技术大牛

发布

社区首页 >问答首页 >在group之后，我想对那些在python中有超过5个成员的组进行聚合，我应该怎么做？

问在group之后，我想对那些在python中有超过5个成员的组进行聚合，我应该怎么做？
EN

Stack Overflow用户

提问于 2022-03-27 01:55:16

回答 1查看 42关注 0票数 1

我有节能计划数据集的价值

我想回答这个问题:仅考虑到至少有5家上市公司的非贸易协定，每个新贸易协定的平均储蓄总额和创造的总就业岗位是多少？

因此，我在第一部分中使用了以下代码：

df['NTA_mod']=df['NTA'].str.split('-')
df=df.explode('NTA_mod').reset_index(drop=True)

df_NTA_grp=df.groupby(['NTA_mod'])

现在我必须选择那些NTA大于5的，并且我使用了以下代码

df.groupby('NTA_mod').filter(lambda x: len(x) >= 5)

然而，我没有得到任何回应，我也不知道如何继续回答这个问题。我应该如何选择那些至少有5家企业的NTA？我的方法正确吗？如果现在是的话，我该如何进行汇总才能得到下一步的平均和和呢？

python

filter

group-by

count

pandas-groupby

回答 1

Stack Overflow用户

发布于 2022-03-27 04:34:21

你走的方向是对的。用aggregate方法求平均值和和。aggregate可以对不同的列执行不同的操作。

df_ge_5 = df_NTA_grp.filter(lambda x: len(x) >= 5)

df_ge_5.groupby('NTA_mod').agg({ 
    'Total Savings': 'mean',
    'Job created': 'sum',
})
# Or, renaming columns with named aggregation
aggn = {
    'Average Total Savings': ('Total Savings', 'mean'),
    'Total Jobs Created': ('Job created','sum'),
}
df_ge_5.groupby('NTA_mod').agg(**aggn)

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/71633163

复制

相似问题

问在group之后，我想对那些在python中有超过5个成员的组进行聚合，我应该怎么做？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在group之后，我想对那些在python中有超过5个成员的组进行聚合，我应该怎么做？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在group之后，我想对那些在python中有超过5个成员的组进行聚合，我应该怎么做？
EN