我在dataset上运行了以下命令:
data.groupby(['month', 'item'])['date'].median()产出如下:
month item
2014-11 call 107
data 29
sms 94
2014-12 call 79
data 30
sms 48但是,我需要这样的输出:
month item
2014-11 call 107
2014-11 data 29
2014-11 sms 94
2014-12 call 79
2014-11 data 30
2014-11 sms 48我可以用什么来达到上述目的呢?
发布于 2016-02-25 10:27:50
从您的问题中还不完全清楚您希望您的DataFrame是什么样子(特别是,索引应该是什么)。
如果您通过.reset_index()跟踪您的操作,您将得到如下内容:
df = pd.DataFrame({'a': [1, 1, 2, 2], 'b': [1, 2, 1, 2], 'c': range(4)})
df.c.groupby([df.a, df.b]).sum().reset_index()
a b c
0 1 1 0
1 1 2 1
2 2 1 2
3 2 2 3也就是说,具有运行索引的DataFrame。
如果您通过.reset_index().set_index('month')跟踪您的操作,您将得到如下内容:
df = pd.DataFrame({'a': [1, 1, 2, 2], 'b': [1, 2, 1, 2], 'c': range(4)})
df.c.groupby([df.a, df.b]).sum().reset_index().set_index('a')
b c
a
1 1 0
1 2 1
2 1 2
2 2 3https://stackoverflow.com/questions/35624258
复制相似问题