我正在处理相当大的数据集(appx )。每月4行,有25个数字属性和4个因素属性)。我想要创建一个包含每个月(过去36个月)的图表,为每个产品的每个数字属性(4个因素属性之一)绘制一个方格图。
因此,作为产品A的一个例子:
-
_ | -
_|_ | _|_
| | | | |
| | _|_ | |
| | | | |---|
| | |---| | |
|---| | | | |
|_ _| | | |_ _|
| |_ _| |
| | |
- | -
-
--------------------------------------------------------------
jan '10 feb '10 mar '10 ................... feb '13但是,由于这些数据集非常大,我将使用这些数据集,因此我希望就如何处理这些数据集提供一些建议。我的想法(但我不确定这是否可能)是
因此,我的主要问题是:是否可以将单独的盒型摘要合并为一个,并创建上面所描述的组合图?
任何帮助都将不胜感激,
谢谢
发布于 2013-03-01 01:05:39
下面是一个很长的例子,您可能会在周围做一些东西:
读取单个数据集--考虑到所使用的大数据,您可能希望覆盖相同的数据或将此步骤封装在函数中。
dset1 <- 1:10
dset2 <- 10:20
dset3 <- 20:30存储一些盒图信息,注意plot=FALSE
result1 <- boxplot(dset1,plot=FALSE,names="month1")
result2 <- boxplot(dset2,plot=FALSE,names="month2")
result3 <- boxplot(dset3,plot=FALSE,names="month3")用bxp对数据进行分组和绘图
mylist <- list(result1, result2, result3)
groupbxp <- do.call(mapply, c(cbind, mylist))
bxp(groupbxp)结果:

发布于 2013-02-28 23:45:53
您将无法绝对精确地预测"fivenum“值的值将用于值的组合。考虑两组的情况,每组中有第75百分位数,每组中有观察数。假设百分位数不相等。不能只取百分位数的加权平均数来获得聚集值的第75百分位数。请参阅?boxplot.stats的帮助页。但是,我认为,通过使用fivenum集合的中值,您可能会非常接近。这可能是开始你考试的地方。
mo.mtx <- tapply(dat$values, dat$month, function( mo.dat) c( fivenum(mo.dat), length(mo.dat) )
matplot( mo.mtx[, 1:5] , type="l" )https://stackoverflow.com/questions/15147203
复制相似问题