我正在尝试基于某些条件对数据集进行引导。
下面是我的数据的快照,顶行是列名。我的数据大约有10k行。
v1
0
0
0
0
1
0
0
0
1
0
0我想通过随机重新采样v1来生成一个新的数据集,直到有一个1,并进行观察计数。例如,第一次迭代对数据重新采样x次,直到出现1为止,并记录对数据重新采样的次数。
添加了更多细节,因为我一直不清楚...
下面是一个输出示例。
bootstrap_output
3
10
5
1
6
7该数字是在v1中进行多少次重采样以获得值1的结果。对于第一行,它对v1重采样三次,直到值为1。因此,重采样序列为(0,0,1)。第二行的重采样序列是(0,0,0,0,0,0,0,0,0,0,0,1)
发布于 2019-12-23 09:11:03
我认为你正在寻找一个几何分布,其中0代表失败,1代表成功,你一直采样直到你选择1。
set.seed(1L)
DF <- data.frame(v1=c(0,0,0,0,1,0,0,0,1,0,0))
(bootstrap_output <- rgeom(6, sum(DF$v1) / nrow(DF)))使用set.seed(1L)的示例输出
#[1] 3 2 13 0 6 1https://stackoverflow.com/questions/59428158
复制相似问题