我有900个应用程序的目录。我需要确定它们的可靠性是如何作为一个整体分布的。(即它是否正常)。
我可以衡量单个应用程序的可靠性。
我如何才能在不测量每个人的情况下确定整个组的可靠性?
发布于 2013-07-19 00:27:20
这是一个相当开放的问题!总体而言,分布拟合可能是相当具有挑战性的,并且在大样本(100甚至1000)时效果最好。通常,基于您试图建模的过程的已知特征选择建模分布比尝试纯经验拟合更好。
如果你打算进行实证,首先你可以随机抽样,测量样本的可靠性分数(无论你使用什么),对它们进行排序,并绘制它们与正常分位数的关系图。如果它们沿着一条相对直线下降,则正态分布是一个合理的模型,您可以估计样本均值和方差以将其参数化。您可以应用相同的想法绘制与其他建议分布中的分位数,以查看它们是否也是合理的。
特别要注意尾部的行为。根据定义,尾部很少出现,并且可能在您的样本中表示不足。就像所有统计学上的东西一样,你可以利用的样本越大,你的结果就越好。
我还想补充说,我之前的想法是正态分布不是一个很好的拟合。你的可靠性分数可能会落在一个有界的范围内,倾向于更多地落在这个范围的一边或另一边。如果他们倾向于高范围,我预测他们会在范围的末端被剔除,并有一条长尾向低端,反之亦然,如果他们倾向于低范围。
https://stackoverflow.com/questions/17725838
复制相似问题