首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Group by和values_counts

Group by和values_counts
EN

Stack Overflow用户
提问于 2019-08-11 15:59:52
回答 1查看 78关注 0票数 3

我的df看起来是这样的

代码语言:javascript
复制
session_id page_type
10001_0    a
10001_0    b
10001_0    b
10001_0    b
10001_0    c
10001_0    c
10002_0    a
10002_0    a
10002_0    b
10002_0    b
10002_0    c
10002_0    c

我想按'session_id‘分组,并将值(’a‘,'b','c')计数为:

代码语言:javascript
复制
session_id count_page_type
10001_0 {a:1,b:3,c:2}
10002_0 {a:2,b:2,c:2}

我不关心'count_page_type‘列中的类型,它也可以是list。聚合在多个列上,

代码语言:javascript
复制
agg_dict = ({'uid':'first',
             'request_id':'unique',
             'sso_id':'first',
             'article_id' :['first','last','nunique'],
             'event_time':['min','max'],
             'session_duration':'sum',
             'anonymous_id':['first','nunique'],
             'platform':['first','nunique'],
             'brand':['first','last','nunique'],
             'user_type':['first','last'],
             'page_type':'value_counts'})
df.groupby('session_id').agg(agg_dict)

现在我得到了错误

代码语言:javascript
复制
ValueError: cannot insert page_type, already exists

有什么建议吗?谢谢

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-08-11 17:29:46

value_counts返回的不只是一行,而是一个pd.Series,请尝试这样做:

代码语言:javascript
复制
df.groupby('session_id').agg({'page_type': lambda x : x.value_counts().to_dict()})
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57448313

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档