我有273个人(组)的数据集和超过2000的测量(不平衡)。我想创造一个随机的样本,替换个人,包括他们的所有测量。
是否有任何明智的方法来做到这一点,或者我是否必须创建新的数据集并逐行重复添加新数据?
编辑:
我的数据集如下所示:
id time quantil
1 124 0.245
1 178 0.324
2 304 0.124
5 102 0.178
5 752 0.724
5 822 0.687
... 我想要创建新的数据集,其中包含273名土著人的随机样本,并对其进行替换和测量。所以如果我的个人样本是2,5,2.我的新数据集是
id time quantil
2 304 0.124
5 102 0.178
5 752 0.724
5 822 0.687
2 304 0.124
... 发布于 2014-11-18 09:26:15
命令
samp <- sample(unique(dat$id), 273, replace = TRUE)将采集273份身份证。这些可以用来创建新的数据集。data.table包允许高效处理:
library(data.table)
datDT <- as.data.table(dat)
setkey(datDT, "id")
# create the new data set
dat_new <- datDT[J(samp), allow.cartesian = TRUE]https://stackoverflow.com/questions/26983461
复制相似问题