UPDATE:我找到了下面的C#库,它非常适合我需要的东西。
==============================================================
所以我收集了一个数据点,例如: 4,5,2,3,15,3,3,5,然后我计算出上四分位数(Q2)和下四分位数(Q1),它们分别是5和3。
由于四分位数,我可以引用从最低的数字到Q1,以目标低的25%,然后从最高的值到Q2,以目标的前25%。因为我现在有了Q1和Q2,所以我也可以将50%的内部值作为目标。
有了这些信息,我想知道我们90%的数据下降的地方,而且我还没有在网上找到任何参考资料,除了25%的其他百分比。
如果有帮助的话,我正在使用的服务器端语言是C#和.NET 4.5,但是我更想知道它背后的数学知识,而不是编程实现它的方式。
任何帮助都是非常感谢的。希望我所写的足够清楚。
谢谢。
发布于 2013-10-23 20:26:01
你问具体的数学参考,所以我将不包括任何代码。
要做的第一件事是为分位数函数(在x轴上有概率,y轴上有值)构造节点。这样做的方法是对值进行排序,以便在您的示例中得到以下表:
Probability Value
1/8 2
4/8 3
5/8 4
7/8 5
8/8 15然后构造了一个经过这些点的单调三次样条插值器。您使用一次三次样条,因为(1)分位函数永远不会有负斜率;(2)它必须连续到至少一阶(因为分位数函数的一阶导数的倒数是概率密度函数)。
然后,可以使用内插器查找其他值。例如,查找90%的内插器值,以给出您有90%机会达到的结果。
当然,节点之间的中间值是从数据中推断出来的,是近似的。
https://stackoverflow.com/questions/19551406
复制相似问题