首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >交叉验证与置信区间的关系

交叉验证与置信区间的关系
EN

Data Science用户
提问于 2020-06-25 04:05:54
回答 1查看 121关注 0票数 2

我从一个来源中读到,我忘记了“在交叉验证中,选择了95%置信区间得分最好的模型”。

但根据我的统计知识,为了使CI (置信区间)工作,需要对实验的抽样统计量进行正态假设。

但是,如何从未知的来源,它似乎简单地利用每个流的结果来构造样本均值&置信区间。在我看来,这两种方法都没有检验中心极限定理的检验。在我看来,这也是人们正在做的事情:

(1)在抽样手段(而不是抽样分布)中自动假定正态分布;(2) CLT自动满足。

我想知道这是我的误解,还是这个行业正在采用一种过于宽松的规范?谢谢。

EN

回答 1

Data Science用户

发布于 2020-10-05 12:11:36

这取决于如何产生置信区间(CI)。最常用的方法是在样本均值上,假设样本是从正态分布中提取的。然而,一个CI可以产生从任何统计的观测数据。另一种方法将通过自举,重采样统计量,这不需要正态假设。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/76638

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档