我有数据集,有相当多的数据缺失,其中存储每小时数年的数据。现在,我将实施一个季节性填充方法,在那里我需要我有最好的数据,为以后的两年(2*8760条目)。这意味着以后两年丢失的数据最少(或nan值最少)。然后,我需要这段时间的结束时间和开始时间的日期时间格式。我的数据存储在dataframe中,其中索引是每小时的日期时间。我怎样才能做到这一点?
编辑:为了更清楚一点,我需要从出现最少nan值的两年(或2*8760行)的时间段中选择所有条目(值和nan值)。
发布于 2022-05-16 11:28:23
可以使用df = df.dropna()从数据中删除所有NAN值。
https://stackoverflow.com/questions/72258335
复制相似问题