我有以下数据:
set.seed(15)
ddf <- data.frame(
gp1 = sample(1:3, 200, replace=T),
gp2 = sample(c('a','b'), 200, replace=T),
param = sample(10:20, 200, replace=T)
)
head(ddf)
gp1 gp2 param
1 2 a 18
2 1 b 11
3 3 a 15
4 2 b 20
5 2 a 17
6 3 b 11我必须创建另一个名为“类别”的列,如果该行的“param”大于gp1和gp2的75百分位数,该列的值需要为1。
我试着跟随,但我不确定这是否正确:
ddf$category = with(ddf, ifelse(param>quantile(ddf[ddf$gp1==gp1 & ddf$gp2==gp2,]$param, .75, na.rm=T), 1, 0) )以上代码是否正确,否则如何做到?谢谢你的帮助。
发布于 2014-11-23 02:34:55
(将"value“改为”param“后)
ddf = data.frame(gp1, gp2, param)
ddf$category <- with(ddf, ave(param, gp1,gp2,
FUN=function(x) x > quantile(x,.95) ) )
> ddf
gp1 gp2 param category
1 2 a 20 0
2 2 a 16 0
3 1 a 12 0
4 1 b 16 0
5 3 b 19 0
snipped
> sum(ddf$category)
[1] 2https://stackoverflow.com/questions/27084753
复制相似问题