我有一个带有日期时间类型列的dataframe,称为时间戳,我想根据时间戳将dataframe拆分为几个dataframe,每个dataframe包含以其值模块化x分钟为值的行,其中x是一个变量。
注意,e和f不是按原来的顺序排列的。使用模块化10分钟,我希望所有的时间结束在3一起,所有的时间结束在1在一起,以此类推。
群时x= 10
timestampe text
0 2016-08-11 12:01:00 a
1 2016-08-13 11:11:00 b
2 2016-08-09 11:13:00 c
3 2016-08-05 11:33:00 d
4 2016-08-19 11:27:00 e
5 2016-08-21 11:43:00 f转到
timestampe text
0 2016-08-11 12:01:00 a
1 2016-08-13 11:11:00 b
0 2016-08-09 11:13:00 c
1 2016-08-05 11:33:00 d
2 2016-08-21 11:43:00 f
0 2016-08-19 11:27:00 e发布于 2016-09-27 15:27:13
您的主要工具将是df.timestampe.dt.minute % 10和groupby。
我使用apply(pd.DataFrame.reset_index)只是为了说明一下
df.groupby(df.timestampe.dt.minute % 10).apply(pd.DataFrame.reset_index)

仅仅使用groupby也是有利的。
for name, group in df.groupby(df.timestampe.dt.minute % 10):
print
print(name)
print(group)
1
timestampe text
0 2016-08-11 12:01:00 a
1 2016-08-13 11:11:00 b
3
timestampe text
2 2016-08-09 11:13:00 c
3 2016-08-05 11:33:00 d
5 2016-08-21 11:43:00 f
7
timestampe text
4 2016-08-19 11:27:00 ehttps://stackoverflow.com/questions/39718157
复制相似问题