我有一个熊猫框架,它的索引是一个DateTimeIndex,我试图推断它的频率,但结果是没有。
df.index
DatetimeIndex(['2020-08-24 00:00:00', '2020-08-24 00:01:00',
'2020-08-24 00:02:00', '2020-08-24 00:03:00',
'2020-08-24 00:04:00', '2020-08-24 00:05:00',
'2020-08-24 00:06:00', '2020-08-24 00:07:00',
'2020-08-24 00:08:00', '2020-08-24 00:09:00',
...
'2021-08-22 23:51:00', '2021-08-22 23:52:00',
'2021-08-22 23:53:00', '2021-08-22 23:54:00',
'2021-08-22 23:55:00', '2021-08-22 23:56:00',
'2021-08-22 23:57:00', '2021-08-22 23:58:00',
'2021-08-22 23:59:00', '2021-08-23 00:00:00'],
dtype='datetime64[ns]', name='timestamp', length=307668, freq=None如你所见,数据以1分钟的频率出现,但当我这样做时:
pd.infer_freq(df.index) # returns None有没有其他方法可以计算出输入频率?有没有一种方法对一些丢失的数据是健壮的?
发布于 2021-08-26 02:44:15
在本例中,freq已经是None,所以您应该尝试:
>>> pd.to_timedelta(np.diff(df.index).min())
Timedelta('0 days 00:01:00')
>>> 或者只是:
>>> np.diff(df.index).min()
numpy.timedelta64(60000000000,'ns')https://stackoverflow.com/questions/68931854
复制相似问题