首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >得到一列的值,它是基于其他几列的,并且是一列的最大值?

得到一列的值,它是基于其他几列的,并且是一列的最大值?
EN

Stack Overflow用户
提问于 2019-01-31 02:26:48
回答 1查看 28关注 0票数 0

我在R上看到了这样的问题(Extract the maximum value within each group in a dataframe),但没有一个真正达到我需要的程度。

我清理的数据是这样的:

代码语言:javascript
复制
      date ticker openprice lowprice closeprice hour min
2015-11-17    EXC     28.53    28.52      28.54    9  31
2015-11-17    EXC     28.53    28.52      28.58    9  32
2015-11-17    EXC     28.57    28.54      28.57    9  33
2015-11-17    AEP     28.59    28.59      28.66    9  34
2015-11-17    AEP     28.66    28.63      28.65    9  35
2015-11-17    AEP     28.64    28.63      28.65    9  36
2015-11-18    EXC     28.53    28.52      28.54    9  31
2015-11-18    EXC     28.53    28.52      28.58    9  32
2015-11-18    EXC     28.57    28.54      28.57    9  33
2015-11-18    AEP     28.59    28.59      28.66    9  34
2015-11-18    AEP     28.66    28.63      28.65    9  35
2015-11-18    AEP     28.64    28.63      28.65    9  36

然后,我需要在每个小时、自动收报机和日期的最小值为min时获取closeprice的值,然后在每个小时、自动收报机和日期的最大值时再次获得最大值。

上面小样本的解决方案应该是这样的(不完全是这样,但你可以理解我想要什么):

代码语言:javascript
复制
date, ticker, hour, hour_beginning_price, hour_end_price
2015-11-17, EXC, 9, 28.54, 28.57
2015-11-17, AEP, 9, 28.66, 28.65
2015-11-18, EXC, 9, 29.54, 29.57
2015-11-18, AEP, 9, 29.66, 29.65

因此,您可以在R中加载示例数据:

代码语言:javascript
复制
blep<-read.table(header = TRUE, text = '          date ticker openprice lowprice closeprice hour min
    2015-11-17    EXC     28.53    28.52      28.54    9  31
    2015-11-17    EXC     28.53    28.52      28.58    9  32
    2015-11-17    EXC     28.57    28.54      28.57    9  33
    2015-11-17    AEP     28.59    28.59      28.66    9  34
    2015-11-17    AEP     28.66    28.63      28.65    9  35
    2015-11-17    AEP     28.64    28.63      28.65    9  36
    2015-11-18    EXC     28.53    28.52      29.54    9  31
    2015-11-18    EXC     28.53    28.52      29.58    9  32
    2015-11-18    EXC     28.57    28.54      29.57    9  33
    2015-11-18    AEP     28.59    28.59      29.66    9  34
    2015-11-18    AEP     28.66    28.63      29.65    9  35
    2015-11-18    AEP     28.64    28.63      29.65    9  36')

我已经尝试了一段时间来学习如何做到这一点,但一无所获,我总是试图首先自己解决我的问题,但我不确定如何正确地将aggregate的输出与其中的组合,或者这是否是正确的方法:

代码语言:javascript
复制
which(apply(sd, function(x) all(x == aggregate(sd$min, by = list(sd$date, sd$ticker, sd$hour), max))))
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-01-31 02:37:04

以下是使用dplyr的解决方案:

代码语言:javascript
复制
library(dplyr)

blep %>% 
  group_by(date, ticker, hour) %>% 
  arrange(date, ticker, hour, min) %>% 
  summarize(hour_beginning_price = first(closeprice),
            hour_end_price = last(closeprice))

关键是按分钟排序,第一条记录是每组中分钟的最小值,最后一条记录是分钟的最大值。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54447184

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档