问交叉验证与置信区间的关系
EN

Data Science用户

提问于 2020-06-25 04:05:54

回答 1查看 121关注 0票数 2

我从一个来源中读到，我忘记了“在交叉验证中，选择了95%置信区间得分最好的模型”。

但根据我的统计知识，为了使CI (置信区间)工作，需要对实验的抽样统计量进行正态假设。

但是，如何从未知的来源，它似乎简单地利用每个流的结果来构造样本均值&置信区间。在我看来，这两种方法都没有检验中心极限定理的检验。在我看来，这也是人们正在做的事情：

(1)在抽样手段(而不是抽样分布)中自动假定正态分布；(2) CLT自动满足。

我想知道这是我的误解，还是这个行业正在采用一种过于宽松的规范？谢谢。

发布于 2020-10-05 12:11:36

这取决于如何产生置信区间(CI)。最常用的方法是在样本均值上，假设样本是从正态分布中提取的。然而，一个CI可以产生从任何统计的观测数据。另一种方法将通过自举，重采样统计量，这不需要正态假设。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/76638

复制

相似问题

问交叉验证与置信区间的关系EN