我从一个来源中读到,我忘记了“在交叉验证中,选择了95%置信区间得分最好的模型”。
但根据我的统计知识,为了使CI (置信区间)工作,需要对实验的抽样统计量进行正态假设。
但是,如何从未知的来源,它似乎简单地利用每个流的结果来构造样本均值&置信区间。在我看来,这两种方法都没有检验中心极限定理的检验。在我看来,这也是人们正在做的事情:
(1)在抽样手段(而不是抽样分布)中自动假定正态分布;(2) CLT自动满足。
我想知道这是我的误解,还是这个行业正在采用一种过于宽松的规范?谢谢。
https://datascience.stackexchange.com/questions/76638
复制相似问题