我想找出domain列中哪个组的破坏百分比最高。
我试过使用groupby。在我想创建另一个df并存储Breach和meet there.But的总和的地方,我不知道如何将breach和Meet的总和存储到新的数据帧中。
new_df2 = new_df.groupby('Domain')['Breach'].sum()
ID Domain Breach Meet
0 A1 Finance 4 6
1 B1 Finance 5 3
2 C1 IT 2 3
3 D1 IT 7 3输出应在新的数据帧中:
Domain Breach Meet %Breach %Meet
0 Finance 9 9 50% 50%
1 IT 9 6 60% 40%发布于 2019-07-03 10:23:57
您可以使用groupby,然后在调整输出后使用concat
s=df.groupby('Domain').sum()
s=pd.concat([s,s.div(s.sum(1),axis=0).mul(100).astype(str)+'%'],1)
Out[138]:
Breach Meet Breach Meet
Domain
Finance 9 9 50.0% 50.0%
IT 9 6 60.0% 40.0%https://stackoverflow.com/questions/56862064
复制相似问题