我有一个具有连续变量的数据集和一个具有n级别的因子。
我想为每个级别分别绘制一个经验累积分布函数,再加上每个面板中的整体ecdf。重点是比较子集‘(级别’)和整体(完整数据集)。
在一个面板中绘制每个ecdfs很容易(以“钻石”数据集为例):
ggplot(diamonds) +
stat_ecdf(aes(x=carat, colour = color)) +
stat_ecdf(aes(x=carat), lwd=1, linetype="dotted")但是,当我尝试使用faceting选项将级别分隔成面板时
ggplot(diamonds) +
stat_ecdf(aes(x=carat, colour = color)) +
stat_ecdf(aes(x=carat), lwd=1, linetype="dotted") +
facet_wrap(~color, ncol=4)与具有子集ecdf和整体ecdf (点)的n面板不同,我得到每个子集的ecdf绘制了两次。
我肯定我漏掉了一些显而易见的东西。如果我是在复制别人的问题,请随时向我提出相关的问题。
发布于 2014-07-18 15:54:46
另一种黑客解决方案是,在绘制整个ecdf时,从color数据集中删除diamonds变量:
ggplot(diamonds) +
stat_ecdf(aes(x=carat, colour = color)) +
stat_ecdf(data=diamonds[, names(diamonds) != "color"], aes(x=carat), lwd=1, linetype="dotted") +
facet_wrap(~color, ncol=4)https://stackoverflow.com/questions/24818995
复制相似问题