我正在使用一个由三个键给出的熊猫多重索引:
ProjektIndex,Datum
我想重采样数据在每小时数据,这下降了正确的colum TagDesAbdichtens,我想保持它是静态的。
Verbundzuordnung ProjektIndex Datum TagDesAbdichtens
1 81679 2021-11-10 00:00:00+00:00 2021-12-08
2021-11-10 00:00:00+00:00 2021-12-08
2021-11-10 00:00:00+00:00 2021-12-08
2021-11-10 00:00:00+00:00 2021-12-08
2021-11-10 00:00:00+00:00 2021-12-08
... ... ... ...
2 94574 2022-02-28 23:00:00+00:00 2022-01-31
2022-02-28 23:00:00+00:00 2022-01-31
2022-02-28 23:00:00+00:00 2022-01-31
2022-02-28 23:00:00+00:00 2022-01-31
2022-02-28 23:00:00+00:00 2022-01-31
285192 rows × 1 columns为了更容易理解,我在这里遗漏了一些重要的专栏。
目前,我正在应用此方法对数据进行重采样。
all_merged = all_merged.groupby([
pd.Grouper(level='Verbundzuordnung'),
pd.Grouper(level='ProjektIndex'),
pd.Grouper(level='Datum', freq='H')]
)all_merged.mean()给了我想要的输出,TagDesAbdichtens丢失了。每个Verbundzuordnung和ProjektIndex的值列表都是唯一的和静态的,我想让它回到重放版本中。
有什么办法可以和本地熊猫一起玩吗?
发布于 2022-12-04 13:26:18
我已经成功地使用了本机resample函数进行重采样。例如,
resample_dict = {
'Verbundzuordnung': 'mean',
'ProjektIndex': 'mean',
'TagDesAbdichtens': 'first'
}
data = data.resample("60T", closed='left', label='left').apply(resample_dict)您可以将任何分组键(而不是mean)应用于您的列(例如first、min、max等)。
有关更多信息,请参见https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.resample.html。
发布于 2022-12-04 13:41:36
而不是mean(),您可以执行以下操作
agg({'TagDesAbdichtens': 'first', 'another_col': 'mean', 'another_col2': 'mean', ... })也就是说,您可以为每个列指定一个不同的聚合函数。
https://stackoverflow.com/questions/74675902
复制相似问题