我需要向客户解释为什么在两个理应不同的考试之间会出现受骗现象。自从Prob和Stats以来已经20年了。
我有一个生成的选择题考试。数据库中有192个问题,其中100个是随机选择的(没有副本)。
显然,这样产生的任何两个考试之间至少有8个被骗的可能性是100%。(信鸽原理)
我如何计算出现25个副本的概率? 50个副本? 75个副本?
--事后编辑--我在excel中运行,取n-100的概率和,对于这个特定的问题,概率是
n P(n+ dupes)
40 97.5%
52 ~50%
61 ~0发布于 2008-09-25 22:18:34
嗯,这对我来说真的很模糊。但是有(192个选择100个)可能的考试,对吗?
有(100选择N)种方法来选择N个副本,每种方法都有(92选择100-N)种方法来选择其余的问题,不是吗?
因此,选择N个受骗对象的概率不就是:
(100选择N) * (92选择100-N) / (192选择100)
编辑:因此,如果你想要N个或更多的重复的机会,而不是确切的N,你必须将所有N的值的分数的上半部分相加,从最小的重复数到100。
呃,也许..。
发布于 2008-09-25 22:13:09
一旦创建了第一个考试,就有92个问题从未使用过,100个问题已经使用过。如果您现在生成另一个考试,其中包含100个问题,您将从一组从未使用过的92个问题中进行选择,并从已使用过的100个问题中进行选择。显然,你会得到相当多的副本。
你预计会得到( 100 /192) *100个重复,即在任意两个随机选择的考试中,(平均)将有52个重复的问题。
如果你想知道有25或75的概率,那么你有两个选择。
a)计算出数学
b)在计算机上模拟几次运行
发布于 2008-09-25 22:02:46
它可能比你想象的要高。我不会尝试复制这篇文章:http://en.wikipedia.org/wiki/Birthday_paradox
https://stackoverflow.com/questions/136456
复制相似问题