假设一些名为logData的测量数据(实际上是每分钟提供的)
import pandas as pd, numpy as np
idxData = pd.to_datetime(['08:00', '08:15', '08:30', '08:45', '09:00'])
logData = pd.DataFrame(np.array([1.0, 2.0, 3.0, 4.0, 5.0]), columns=['val'], index=idxData)
idxRng = pd.interval_range(idxData[0], idxData[-1], freq='30min')
avgData = logData.groupby( pd.cut(logData.index, idxRng) ).mean()数据被分组为avgData,例如如下所示:
val
(08:00:00, 08:30:00] 2.5
(08:30:00, 09:00:00] 4.5这个被降采样的avgData现在应该(在执行了其他一些计算之后)再次被过采样,例如,到freq='10min'的一个频率进行进一步的计算。由于avgData.resample('10min')引发以下错误,因此问题是如何重采样分类数据
TypeError: Only valid with DatetimeIndex, TimedeltaIndex or PeriodIndex, but got an instance of 'CategoricalIndex'事先非常感谢!
发布于 2020-11-08 15:33:55
我花了一小段时间才弄清楚如何有意义地转换一个分类索引,但是index.categories.mid似乎有效,允许通过
avgData.set_index( pd.DatetimeIndex( avgData.index.categories.mid ), inplace=True)
avgData = avgData.resample('5min').interpolate(method='nearest')产生预期结果:
val
08:15:00 2.5
08:20:00 2.5
08:25:00 2.5
08:30:00 2.5
08:35:00 4.5
08:40:00 4.5
08:45:00 4.5发布于 2020-11-08 13:29:37
为了使重采样工作,您的索引需要有一个datetime64ns的数据类型,通过运行下面的代码检查索引的数据类型。
avgData.index.dtypehttps://stackoverflow.com/questions/64736835
复制相似问题