首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >为什么我会得到如此不同的样本大小的相似的顺式集成电路?

为什么我会得到如此不同的样本大小的相似的顺式集成电路?
EN

Stack Overflow用户
提问于 2022-04-04 00:48:36
回答 1查看 59关注 0票数 0

我刚刚学会了如何在R中做引导,我很兴奋。我在玩一些数据,发现,不管我拿了多少个引导样本,独联体似乎总是在同一个地方。我相信,样本越多,CI越窄。这是密码。

代码语言:javascript
复制
library(boot)

M.<-function(dados,i){
d<-dados[i,]
mean(d$queimadas)
}

bootmu<-boot(dados,statistic=M.,R=10000)

boot.ci(bootmu)
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 10000 bootstrap replicates

CALL : 
boot.ci(boot.out = bootmu)

Intervals : 
Level      Normal              Basic         
95%   (18.36, 21.64 )   (18.37, 21.63 )  

Level     Percentile            BCa          
95%   (18.37, 21.63 )   (18.37, 21.63 )  
Calculations and Intervals on Original Scale
Warning message:
In boot.ci(bootmu) : bootstrap variances needed for studentized intervals

可以看到,我采集了10000个样本。现在,让我们试一试,只有100。

代码语言:javascript
复制
bootmu<-boot(dados,statistic=M.,R=100)

boot.ci(bootmu)
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 100 bootstrap replicates

CALL : 
boot.ci(boot.out = bootmu)

Intervals : 
Level      Normal              Basic         
95%   (18.33, 21.45 )   (18.19, 21.61 )  

Level     Percentile            BCa          
95%   (18.39, 21.81 )   (18.10, 21.10 )  
Calculations and Intervals on Original Scale
Some basic intervals may be unstable
Some percentile intervals may be unstable
Warning : BCa Intervals used Extreme Quantiles
Some BCa intervals may be unstable
Warning messages:
1: In boot.ci(bootmu) :
  bootstrap variances needed for studentized intervals
2: In norm.inter(t, adj.alpha) :
  extreme order statistics used as endpoints
> 

样品尺寸要低很多倍,但顺式基本上是一样的。为什么?

如果有人想复制完全相同的例子,下面是数据。

代码语言:javascript
复制
> dados
   queimadas plantacoes
1         27        418
2         13        353
3         21        239
4         14        251
5         18        482
6         18        361
7         22        213
8         24        374
9         21        298
10        15        182
11        23        413
12        17        218
13        10        299
14        23        306
15        22        267
16        18         56
17        24        538
18        19        424
19        15         64
20        16        225
21        25        266
22        21        218
23        24        424
24        26         38
25        19        309
26        20        451
27        16        351
28        15        174
29        24        302
30        30        492
EN

回答 1

Stack Overflow用户

发布于 2022-04-04 00:56:58

估计器的置信区间不取决于引导复制的数量,而是取决于原始数据集的大小。

增加引导复制的数量将提高计算抽样分布(因此,置信区间)的精度,但不能使您对样本平均值的估计更加精确。

试着用一种比较的分析方法计算平均值附近的置信区间。

代码语言:javascript
复制
> confint(lm(dados$queimadas~1))
               2.5 %   97.5 %
(Intercept) 18.27624 21.72376

您将看到,这两个引导程序(有100个或10000个样本)都很好地估计了线性回归计算的CI值。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71730973

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档