我有每小时的日期/时间,它给出了每小时的水系流量和每小时的日期/时间,这给出了水系泥沙浓度的不规则间隔。我不确定如何在这里发布数据帧,但它看起来如下所示:
Datetimedis, Discharge, Datetimesed, Sediment
6/12/15 12:00 1.1 6/12/15 18:00 1231
6/12/15 13:00 113 6/13/15 1:00 12312
6/12/15 14:00 123 21 6/13/15 8:00 12321
6/12/15 15:00 12 6/13/15 15:00 12312
6/12/15 16:00 12 6/14/15 19:00 4324
6/12/15 17:00 23 6/15/15 2:00 534523
6/12/15 18:00 123 6/15/15 9:00 52341等
我有大约2500原始的流量数据和大约500列的沉积物数据。有没有办法使用ddply或R包或python将沉淀值粘贴到与同一时间对应的排泄值旁边?
例如,在此示例数据中,我希望将6/12/15 18:00的沉淀值粘贴到当时的流量值旁边。
我需要将它们粘贴到那里,中间的空格包含NA值或空值,以便稍后可以对它们进行插值。
发布于 2015-07-22 09:21:29
假设您有一个包含日期时间和流量(Df)的数据帧,以及另一个包含时间和沉积物浓度(Df2)的数据帧,您可以对python pandas执行以下操作...
使用df中的Datetime创建一个新列:
df['hours'] = df.index.hour然后使用pandas的map函数将df2中的泥沙浓度映射到df:
df['Sediment']=df['hours'].map(df2)发布于 2015-07-22 09:30:46
我用动物园包解决了这个问题!
对于将来使用此作为参考的任何人,我将两个单独的日期和值条目拆分为单独的数据框d1和d2。
zoo1 <- read.zoo(d1, header=TRUE)
zoo2 <- read.zoo(d2, header=TRUE)
zoomerge <- merge(d1, d2)完美地工作了!
https://stackoverflow.com/questions/31551427
复制相似问题