我在DataFrame df_pivoted中包含了下表:
* val1 *
user_id *3
timestamp *
2011年1月1日1月1日,月1日,10月1日,3月5日
2011年2月1日: 20 :00:30:00:18:00
2012年07月1日19 :00- 57 :00
2012年1月11日* 49
21/12/2012 *
2013年9月14日21 :00- 63 :00
2013年1月12日财报: 3200元人民币;51元人民币
我想要计算每月的平均成本,但是语句df_monthly = pivoted.resample ('M')不返回平均值,而只返回月份值的总和。另外,我想知道如何计算与每个用户相关联的每个字段的平均成本(“成本”,“val1”等)。
获取上表所使用的代码为:
import pandas as pd
newnames = ['timestamp','user_id', 'cost', 'val1','val2', 'val3','code']
df = pd.read_csv('mytest.csv', names = newnames, header = False, parse_dates=True, dayfirst=True)
df['timestamp'] = pd.to_datetime(df['timestamp'], dayfirst=True)
pivoted = df.pivot('timestamp', 'user_id')提前感谢您的帮助。
发布于 2014-04-01 23:46:06
请参阅文档http://pandas.pydata.org/pandas-docs/version/0.13.1/generated/pandas.DataFrame.resample.html,您需要指定重采样的方式,例如sum或mean。您可以按字段指定...默认值是mean,,不能确切地确定为什么要得到sum。
https://stackoverflow.com/questions/22790019
复制相似问题