我的df看起来像,
A B C D
2017-10-01 2017-10-11 M 2017-10
2017-10-02 2017-10-03 M 2017-10
2017-11-01 2017-11-04 B 2017-11
2017-11-08 2017-11-09 B 2017-11
2018-01-01 2018-01-03 A 2018-01dtype of A和B为datetime64,C和D为strings;
我喜欢groupby,C和D,了解B和A之间的区别,
df.groupby(['C', 'D']).apply(lambda row: row['B'] - row['A'])但我不知道如何在每个组中求和这些差异,并将值赋给一个新的列,比如E,可能在一个新的df中,
C D E
M 2017-10 11
M 2017-10 11
B 2017-11 4
B 2017-11 4
A 2018-01 2发布于 2018-03-16 16:03:29
基于你的代码
df.merge(df.groupby(['C', 'D']).apply(lambda row: row['B'] - row['A']).sum(level=[0,1]).reset_index())
Out[292]:
A B C D 0
0 2017-10-01 2017-10-11 M 2017-10 11 days
1 2017-10-02 2017-10-03 M 2017-10 11 days
2 2017-11-01 2017-11-04 B 2017-11 4 days
3 2017-11-08 2017-11-09 B 2017-11 4 days
4 2018-01-01 2018-01-03 A 2018-01 2 dayshttps://stackoverflow.com/questions/49324988
复制相似问题