首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >熊猫数据汇总计算

熊猫数据汇总计算
EN

Stack Overflow用户
提问于 2015-05-14 10:57:16
回答 3查看 692关注 0票数 2

我有一只熊猫的资料,里面有体育比赛:

代码语言:javascript
复制
Winner      Loser          
A           B
B           A 
A           C

我想有每个球员的输赢统计数据(即A,B和C)。所以对于A来说,结果应该是2-1.对于B应该是1-1,对于C应该是0-1。

我知道如何通过在dataframe上逐行迭代来计算这个值:

代码语言:javascript
复制
for index, match in df.iterrows():
    //code for calculating win-loss here

但我确信还有更多的仿生/熊猫的方法可以做到这一点吗?如有任何提示,我们将不胜感激。

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2015-05-14 11:18:15

您可以使用groupby方法和size聚合来执行此操作。

例如

代码语言:javascript
复制
print df.groupby('Loser').size()

会产生一个有损失数量的数据。

代码语言:javascript
复制
Loser
A         1
B         1
C         1
dtype: int64

然后,您可以按照如下方式将它们组合成分数计数(如果团队没有胜诉或输赢,则使用fillna方法设置默认值)

代码语言:javascript
复制
wins = df.groupby('Winner').size()
losses = df.groupby('Loser').size()

scores = pd.DataFrame({'Wins' : wins, 'Losses' : losses}).fillna(0)

最后的分数算作

代码语言:javascript
复制
   Losses  Wins
A       1     2
B       1     1
C       1     0
票数 2
EN

Stack Overflow用户

发布于 2015-05-14 11:19:03

在这样做的过程中:

代码语言:javascript
复制
win = df.groupby('Winner').count()
los = df.groupby('Loser').count()
score = pd.DataFrame([win.Loser, los.Winner])
score

给予:

代码语言:javascript
复制
        A   B   C
Loser   2   1   0
Winner  1   1   1

以及:

代码语言:javascript
复制
score.T

显示它已转置:

代码语言:javascript
复制
    Loser   Winner
A   2       1
B   1       1
C   0       1

这是上面使用的数据格式:

代码语言:javascript
复制
df = pd.DataFrame({'Winner': list('ABA'), 
                   'Loser': list('BAC')})  

df

  Loser  Winner
0 B      A
1 A      B
2 C      A

所有这些都在一行中:

代码语言:javascript
复制
pd.DataFrame([df.groupby('Winner').count().Loser, 
              df.groupby('Loser').count().Winner]).fillna(0).T

在以下方面的成果:

代码语言:javascript
复制
    Loser   Winner
A   2       1
B   1       1
C   0       1
票数 1
EN

Stack Overflow用户

发布于 2015-05-14 11:21:07

您希望您的结果采用什么格式?

计算输赢的一个简单方法是使用collections.Counter:

代码语言:javascript
复制
import pandas as pd
from collections import Counter

df=pd.DataFrame([['A','B'],['B','C'],['A','C']], columns=['winner','loser'])

win_counts = Counter(df['winner'])

win_counts是一本字典,如下所示:

代码语言:javascript
复制
Counter({'A': 2, 'B': 1})

不过,我更喜欢西蒙吉本斯以上的答案,因为它不需要额外的模块。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30235591

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档