我是一名GIS分析师,正在为一个项目使用R。我对R代码有点生疏了。我有来自无线电颈狐的csv格式的数据,带有日期时间戳和GPS位置。然而,在整个研究过程中,时间间隔发生了变化,因此一些日期每天有3条记录,而另一些日期只有1条记录。例如:
[1] 2014-12-24 03:00:00
[2] 2014-12-24 12:00:00
[3] 2014-12-24 22:00:00. 也有重复的日期时间,我需要精简,但它们有不同的GPS位置:
[55] 2015-11-03 12:00:00
[56] 2015-11-03 12:00:00. 最终,我每天只需要一条记录,我想让它随机选择删除哪条记录,这样我就可以得到混合的时间值。例如:
[1] 2014-12-24 12:00:00
[2] 2014-12-25 22:00:00.我尝试了!duplicate函数,只将日期放在单独的列中,但问题是它只返回第一个值,所以所有时间都在凌晨3:00示例代码:
oneaday6730 <- xFox6730[!duplicated(xFox6730$Date), drop = FALSE]发布于 2017-02-16 06:09:50
使用dplyr,假设mydf是您的数据:
mydf %>%
group_by(Date) %>%
sample_n(1) -> result注意,我对您的数据结构做了一些假设,特别是Date列包含您想要采样的日期。
https://stackoverflow.com/questions/42259953
复制相似问题