首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于某些条件的R自举

基于某些条件的R自举
EN

Stack Overflow用户
提问于 2019-12-21 00:03:06
回答 1查看 34关注 0票数 0

我正在尝试基于某些条件对数据集进行引导。

下面是我的数据的快照,顶行是列名。我的数据大约有10k行。

代码语言:javascript
复制
v1 
0
0
0
0
1
0
0
0
1
0
0

我想通过随机重新采样v1来生成一个新的数据集,直到有一个1,并进行观察计数。例如,第一次迭代对数据重新采样x次,直到出现1为止,并记录对数据重新采样的次数。

添加了更多细节,因为我一直不清楚...

下面是一个输出示例。

代码语言:javascript
复制
bootstrap_output
3
10
5
1
6
7

该数字是在v1中进行多少次重采样以获得值1的结果。对于第一行,它对v1重采样三次,直到值为1。因此,重采样序列为(0,0,1)。第二行的重采样序列是(0,0,0,0,0,0,0,0,0,0,0,1)

EN

回答 1

Stack Overflow用户

发布于 2019-12-23 09:11:03

我认为你正在寻找一个几何分布,其中0代表失败,1代表成功,你一直采样直到你选择1。

代码语言:javascript
复制
set.seed(1L)
DF <- data.frame(v1=c(0,0,0,0,1,0,0,0,1,0,0))
(bootstrap_output <- rgeom(6, sum(DF$v1) / nrow(DF)))

使用set.seed(1L)的示例输出

代码语言:javascript
复制
#[1]  3  2 13  0  6  1
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59428158

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档