我被这个问题难住了,不知道该怎么问。我有一个时间戳表作为列标题。每行都有一个纬度/经度点和一个时间温度。数据只以3小时为增量,我想要完成的是获得整个时间段的每小时温度。我已经能够创建一个列,其中包含数据之间的时间。
下面是一个数据帧示例
Latitude | Longitude | 2021-6-11 10:00 | 2021-6-11 11:00 | 2021-6-11 12:00 | 2021-6-11 13:00
34.698848 | -104.9723 | 83.03 | 0 | 0 | 92.93
34.702147 | -104.9177 | 81.95 | 0 | 0 | 92.93我正在尝试完成的是显示0到13:00温度的列,如92.93-83.03 = 9.9除以3,对于两个时隙= 3.3。输出数据帧应如下所示
Latitude | Longitude | 2021-6-11 10:00 | 2021-6-11 11:00 | 2021-6-11 12:00 | 2021-6-11 13:00
34.698848 | -104.9723 | 83.03 | 86.33 | 86.93 | 92.93
34.702147 | -104.9177 | 81.95 | 85.61 | 89.27 | 92.93我的dataframe每小时继续列一次,持续72小时,但只有每第3列有一个值。我该如何做到这一点?
发布于 2021-06-12 05:30:36
你基本上是在描述规则间隔上的线性插值。以下内容应适用于您的数据帧df
df = df.where(df!=0) # replace 0 with nan
df = df.interpolate(axis=1) # linear interpolation over nan values我的建议:在温度为0°F的情况下,最好直接使用nan值创建新列,而不是使用0值。
https://stackoverflow.com/questions/67942810
复制相似问题