我希望帮助生成使用dplyr组合df多列的方法,而-assuming one可以--我无法正确地理解语法。
df <- data.frame(trt1=c(replicate(6, "far"), replicate(6, "near")),
trt2=rep(c("A","A","A","B","B","B"), 2),
count=sample(1:8, 12, replace=T))我知道如何通过一栏获得手段:
df %>% group_by(trt1) %>% summarise(avg=mean(count))但无法确定列组合的语法:远x A,远x,近x,近x。
非常感谢。
发布于 2016-10-21 13:16:48
在这种情况下,一个简单的线性模型也给出了答案(只需提醒删除拦截以获得正确的对比)(我做了一些调整,以使dplyr看起来更好)
df %>% lm(count~trt1:trt2-1, .) %>% .$coef
#### trt1far:trt2A trt1near:trt2A trt1far:trt2B trt1near:trt2B
#### 4.000000 4.333333 4.000000 4.666667 (由于data.Frame的定义没有种子,所以结果与其他答案不同)
https://stackoverflow.com/questions/40177170
复制相似问题