文章/答案/技术大牛

发布

社区首页 >问答首页 >用熊猫按日期计算数值的频率.第2部分

问用熊猫按日期计算数值的频率.第2部分
EN

Stack Overflow用户

提问于 2018-11-20 06:04:03

回答 1查看 37关注 0票数 1

我有数据集(dataset1)，如下所示：

Date        Company     Weekday

2015-01-01  Company1     Monday

2015-01-02  Company1     Tuesday

2015-01-03  Company1     Wednesday

2015-01-04  Company1     Thursday

2015-12-09  Company2     Monday

2015-12-10  Company2     Tuesday
………………………………………………………………………

2016-01-08  Company3     Wednesday

2016-01-09  Company3     Thursday

然后，我应用以下代码：

dataset2 = dataset1.groupby(['Company','Weekday']).size().sort_values(ascending=False)

一旦应用了上述代码，我将得到以下结果：

Index                        0

('Company1', Monday)        80

('Company1', Tuesday)       80

('Company1', Wednesday)     79
………………………………………………………………….

('Company3', Tuesday)       34

我试图用计数值大于50的值隔离所有dataset2条目，但是当我尝试以下操作时会出现各种错误：

dataset2=dataset2.loc[dataset2[0]>50]

有人能提出意见吗？

python

pandas

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-11-20 06:10:43

使用Series，所以需要：

dataset2 = dataset1.groupby(['Company','Weekday']).size().sort_values(ascending=False)
dataset2 = dataset2[dataset2 > 50]

另一种解决方案是为Series.reset_index添加带有参数name的DataFrame，然后按列count进行筛选。

dataset2 = (dataset1.groupby(['Company','Weekday'])
                    .size()
                    .sort_values(ascending=False)
                    .reset_index(name='count'))

dataset2 = dataset2[dataset2['count'] > 50]

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/53387122

复制

相似问题

问用熊猫按日期计算数值的频率.第2部分
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用熊猫按日期计算数值的频率.第2部分EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用熊猫按日期计算数值的频率.第2部分
EN