首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于列和的熊猫交叉滤波算法

基于列和的熊猫交叉滤波算法
EN

Stack Overflow用户
提问于 2021-02-04 10:19:49
回答 1查看 145关注 0票数 0

我使用Python3和熊猫作为数据集,如下所示(玩具数据集)-

代码语言:javascript
复制
data
      location importance    agent  count
0       London        Low  chatbot      2
1          NYC     Medium  chatbot      1
2       London       High    human      3
3       London        Low    human      4
4          NYC       High    human      1
5          NYC     Medium  chatbot      2
6    Melbourne        Low  chatbot      3
7    Melbourne        Low    human      4
8    Melbourne       High    human      5
9          NYC       High  chatbot      5
10   Melbourne        Low    human      3
11   Melbourne        Low    human      1
12   Melbourne       High  chatbot      5
13  Washington     Medium  chatbot      7
14  Washington     Medium    human      8
15  Washington       High  chatbot      5
16   Melbourne     Medium  chatbot      4
17  Washington     Medium  chatbot      5
18   Melbourne       High    human      3
19  Washington        Low  chatbot      2

熊猫交叉表如下所示-

代码语言:javascript
复制
pd.crosstab(data['location'], data['importance'])

importance  High  Low  Medium
location                     
London         1    2       0
Melbourne      3    4       1
NYC            2    0       2
Washington     1    1       3

问题是要将3列'High‘、'Low’、'Medium‘相加,这样您就只包含了sum >= 4的交叉表行。因此,对于这个例子,它应该排除伦敦,因为它的列sum < 4。

帮助?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-02-04 10:22:33

您可以通过4boolean indexing中的筛选器对行值进行求和和比较。

代码语言:javascript
复制
df1 = pd.crosstab(data['location'], data['importance'])


df = df1[df1.sum(axis=1).ge(4)]

工作方式如下:

代码语言:javascript
复制
df = df1[df1.sum(axis=1)>= 4)]
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66043623

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档