文章/答案/技术大牛

发布

问用Pandas进行数据分析
EN

Stack Overflow用户

提问于 2016-10-28 11:19:24

回答 1查看 133关注 0票数 1

我是熊猫图书馆的新手，需要一些帮助。我有两个这样的专栏：

Test Result       Risk Rating
  Fail               Low                   
  Pass               Medium
  Skip               High
  Pass               Low                   
  Fail               Medium
  Pass               High
  Skip               Low                   
  Fail               Medium
  Fail               High

现在，我需要从“测试结果”列中找到失败、传球和跳过的总数，并且我能够做到这一点。但是，我还需要从“测试结果”列中获得“失败”的总数，而从“风险评级”栏中得到“低”的总数。同样，失败的总次数与中型等等类似。我的最终结果应该是：

Fail (Low Risk Rating) = 1
Fail (Medium Risk Rating) = 2
Fail (High Risk Rating) = 1
Pass (Low Risk Rating) = 1
Pass (Medium Risk Rating) = 1
Pass (High Risk Rating) = 1
Skip (Low Risk Rating) = 1
Skip (Medium Risk Rating) = 0
Skip (High Risk Rating) = 1

我该怎么做？任何帮助都将不胜感激。

pandas

python

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-10-28 11:21:27

我认为您需要同时使用groupby列和聚合size。

df = df.groupby(['Test Result', 'Risk Rating']).size().reset_index(name='counts')
print (df)
  Test Result Risk Rating  counts
0        Fail        High       1
1        Fail         Low       1
2        Fail      Medium       2
3        Pass        High       1
4        Pass         Low       1
5        Pass      Medium       1
6        Skip        High       1
7        Skip         Low       1

也许更好的是带有unstack的枢轴表

df = df.groupby(['Test Result', 'Risk Rating']).size().unstack(fill_value=0)
print (df)
Risk Rating  High  Low  Medium
Test Result                   
Fail            1    1       2
Pass            1    1       1
Skip            1    1       0

或者用crosstab更慢的解决方案

df = pd.crosstab(df['Test Result'], df['Risk Rating'])
print (df)
Risk Rating  High  Low  Medium
Test Result                   
Fail            1    1       2
Pass            1    1       1
Skip            1    1       0

如果需要的话，用0添加stack

df = df.groupby(['Test Result', 'Risk Rating'])
       .size()
       .unstack(fill_value=0)
       .stack()
       .reset_index(name='counts')
print (df)
  Test Result Risk Rating  counts
0        Fail        High       1
1        Fail         Low       1
2        Fail      Medium       2
3        Pass        High       1
4        Pass         Low       1
5        Pass      Medium       1
6        Skip        High       1
7        Skip         Low       1
8        Skip      Medium       0

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/40303957

复制

相似问题

问用Pandas进行数据分析
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用Pandas进行数据分析EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用Pandas进行数据分析
EN