每个资产ID都有两种类型的问题("RSL严重偏差“或"RSL和TX功率偏差”),我们需要计算每个问题在同一资产ID内的重复次数
Asset ID Categorization Tier 3
4053 0001 RSL Critical Deviation
4054 0001 RSL and TX Power Deviation
3342 0005 RSL and TX Power Deviation
3343 0005 RSL and TX Power Deviation
3344 0005 RSL and TX Power Deviation
3345 0005 RSL and TX Power Deviation
3346 0005 RSL and TX Power Deviation
4363 0040 RSL and TX Power Deviation
4055 0046 RSL Critical Deviation
4056 0046 RSL Critical Deviation结果应该是
Asset ID Categorization Tier 3 Count
0001 RSL Critical Deviation 1
RSL and TX Power Deviation 1
0005 RSL Critical Deviation 0
RSL and TX Power Deviation 5发布于 2019-06-23 20:49:46
df.groupby(['ID', 'Categorization']).size()SQL中的groupby语句可以应用于多个列。在熊猫身上也是如此。Pandas实现SQL计数聚合的方法是使用size或count。他们的不同之处在this上得到了回答,所以问题。
https://stackoverflow.com/questions/56723989
复制相似问题