我有数据,看起来是这样的:
DATE Cause Value
0 2019-04-01 Foreign Interference 0.52680
1 2019-04-01 Foreign Interference 0.91260
2 2019-04-02 Equipment 0.03129
3 2019-04-02 Equipment 0.74794
4 2019-04-02 Vegetation - Touching / Burning 0.12511
5 2019-04-02 Incorrect Installation 0.05635
6 2019-04-02 Incorrect Installation 0.03070
7 2019-04-03 Incorrect Installation 0.02296现在,我想按日期对数据框架进行分组,并对值进行总结。但是,如果原因列发生在同一日期,则希望将其作为原因集合显示。所以我想要的输出应该是这样的:
期望输出:
DATE Cause Value
0 2019-04-01 Foreign Interference 1.438
1 2019-04-02 Equipment, 0.9915
Vegetation - Touching / Burning,
Incorrect Installation
2 2019-04-03 Incorrect Installation 0.02296我试图使用groupby(['Date','Cause']),但它没有产生所需的输出。任何帮助都会很感激的。
发布于 2020-05-08 01:45:28
让我们用agg做unique
s=df.groupby('DATE',as_index=False).agg({'Cause': lambda x : ','.join(x.unique()), 'Value':'sum'})https://stackoverflow.com/questions/61670618
复制相似问题