首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用熊猫按日期计算数值的频率.第2部分

用熊猫按日期计算数值的频率.第2部分
EN

Stack Overflow用户
提问于 2018-11-20 06:04:03
回答 1查看 37关注 0票数 1

我有数据集(dataset1),如下所示:

代码语言:javascript
复制
Date        Company     Weekday

2015-01-01  Company1     Monday

2015-01-02  Company1     Tuesday

2015-01-03  Company1     Wednesday

2015-01-04  Company1     Thursday

2015-12-09  Company2     Monday

2015-12-10  Company2     Tuesday
………………………………………………………………………

2016-01-08  Company3     Wednesday

2016-01-09  Company3     Thursday

然后,我应用以下代码:

代码语言:javascript
复制
dataset2 = dataset1.groupby(['Company','Weekday']).size().sort_values(ascending=False)

一旦应用了上述代码,我将得到以下结果:

代码语言:javascript
复制
Index                        0

('Company1', Monday)        80

('Company1', Tuesday)       80

('Company1', Wednesday)     79
………………………………………………………………….

('Company3', Tuesday)       34

我试图用计数值大于50的值隔离所有dataset2条目,但是当我尝试以下操作时会出现各种错误:

代码语言:javascript
复制
dataset2=dataset2.loc[dataset2[0]>50]

有人能提出意见吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-11-20 06:10:43

使用Series,所以需要:

代码语言:javascript
复制
dataset2 = dataset1.groupby(['Company','Weekday']).size().sort_values(ascending=False)
dataset2 = dataset2[dataset2 > 50]

另一种解决方案是为Series.reset_index添加带有参数nameDataFrame,然后按列count进行筛选。

代码语言:javascript
复制
dataset2 = (dataset1.groupby(['Company','Weekday'])
                    .size()
                    .sort_values(ascending=False)
                    .reset_index(name='count'))

dataset2 = dataset2[dataset2['count'] > 50]
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53387122

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档