我在R上看到了这样的问题(Extract the maximum value within each group in a dataframe),但没有一个真正达到我需要的程度。
我清理的数据是这样的:
date ticker openprice lowprice closeprice hour min
2015-11-17 EXC 28.53 28.52 28.54 9 31
2015-11-17 EXC 28.53 28.52 28.58 9 32
2015-11-17 EXC 28.57 28.54 28.57 9 33
2015-11-17 AEP 28.59 28.59 28.66 9 34
2015-11-17 AEP 28.66 28.63 28.65 9 35
2015-11-17 AEP 28.64 28.63 28.65 9 36
2015-11-18 EXC 28.53 28.52 28.54 9 31
2015-11-18 EXC 28.53 28.52 28.58 9 32
2015-11-18 EXC 28.57 28.54 28.57 9 33
2015-11-18 AEP 28.59 28.59 28.66 9 34
2015-11-18 AEP 28.66 28.63 28.65 9 35
2015-11-18 AEP 28.64 28.63 28.65 9 36然后,我需要在每个小时、自动收报机和日期的最小值为min时获取closeprice的值,然后在每个小时、自动收报机和日期的最大值时再次获得最大值。
上面小样本的解决方案应该是这样的(不完全是这样,但你可以理解我想要什么):
date, ticker, hour, hour_beginning_price, hour_end_price
2015-11-17, EXC, 9, 28.54, 28.57
2015-11-17, AEP, 9, 28.66, 28.65
2015-11-18, EXC, 9, 29.54, 29.57
2015-11-18, AEP, 9, 29.66, 29.65因此,您可以在R中加载示例数据:
blep<-read.table(header = TRUE, text = ' date ticker openprice lowprice closeprice hour min
2015-11-17 EXC 28.53 28.52 28.54 9 31
2015-11-17 EXC 28.53 28.52 28.58 9 32
2015-11-17 EXC 28.57 28.54 28.57 9 33
2015-11-17 AEP 28.59 28.59 28.66 9 34
2015-11-17 AEP 28.66 28.63 28.65 9 35
2015-11-17 AEP 28.64 28.63 28.65 9 36
2015-11-18 EXC 28.53 28.52 29.54 9 31
2015-11-18 EXC 28.53 28.52 29.58 9 32
2015-11-18 EXC 28.57 28.54 29.57 9 33
2015-11-18 AEP 28.59 28.59 29.66 9 34
2015-11-18 AEP 28.66 28.63 29.65 9 35
2015-11-18 AEP 28.64 28.63 29.65 9 36')我已经尝试了一段时间来学习如何做到这一点,但一无所获,我总是试图首先自己解决我的问题,但我不确定如何正确地将aggregate的输出与其中的组合,或者这是否是正确的方法:
which(apply(sd, function(x) all(x == aggregate(sd$min, by = list(sd$date, sd$ticker, sd$hour), max))))发布于 2019-01-31 02:37:04
以下是使用dplyr的解决方案:
library(dplyr)
blep %>%
group_by(date, ticker, hour) %>%
arrange(date, ticker, hour, min) %>%
summarize(hour_beginning_price = first(closeprice),
hour_end_price = last(closeprice))关键是按分钟排序,第一条记录是每组中分钟的最小值,最后一条记录是分钟的最大值。
https://stackoverflow.com/questions/54447184
复制相似问题