其思想是将频率表转换为geom_density可以处理的内容(ggplot2)。
从频率表开始
> dat <- data.frame(x = c("a", "a", "b", "b", "b"), y = c("c", "c", "d", "d", "d"))
> dat
x y
1 a c
2 a c
3 b d
4 b d
5 b d使用dcast制作频率表
> library(reshape2)
> dat2 <- dcast(dat, x + y ~ ., fun.aggregate = length)
> dat2
x y count
1 a c 2
2 b d 3如何才能扭转这一局面呢?melt似乎不是答案:
> colnames(dat2) <- c("x", "y", "count")
> melt(dat2, measure.vars = "count")
x y variable value
1 a c count 2
2 b d count 3发布于 2013-08-02 14:36:52
因为您可以使用任何聚合函数,所以在不知道如何反转聚合的情况下,将无法反转dcast (聚合)。
对于length来说,明显相反的是rep。对于像sum或mean这样的聚合,没有明显的反转(假设您没有将原始数据保存为属性)
用于反转length的一些选项
您可以使用ddply
library(plyr)
ddply(dat2,.(x), summarize, y = rep(y,count))或者更简单地说
as.data.frame(lapply(dat2[c('x','y')], rep, dat2$count))https://stackoverflow.com/questions/18010069
复制相似问题