简写版:
可以添加/合并StdDevs吗?即
if StdDev(11,14,16,17)=X and StdDev(21,34,43,12)=Y
can we calculate StdDev(11,14,16,17,21,34,43,12) from X & Y长版本:
我正在设计一个星型模式。模式有一个fact_table (grain=transaction),它存储单个事务response_time。该模式还具有一个aggregate_table (grain=day),它每天存储response_time_sum。
在我的报告中,我需要计算给定时间维度的响应时间的标准差,比如日、周、月等。如何使用StandardDeviation而不是接触巨大的fact_table来计算fact_table?
发布于 2011-10-13 12:00:23
是的,你可以把它们结合起来。你需要知道每一天的观测数、平均值和标准差。方差比标准差更容易处理,所以我将用方差来表示其他的一切。(标准差被定义为方差的平方根。)
表示:
n[i] # observations for day i
m[i] # mean for day i
v[i] # variance for day i您需要计算观察N的总数和总体平均M。这很简单:
days = [day1, day2, ..., day_final]
N = sum(n[i] for i in days)
M = sum(n[i] * m[i] for i in days) / N总体方差V比较复杂,但仍然可以计算:
s1 = sum(n[i] * v[i] for i in days)
s2 = sum(n[i] * (m[i] - M)**2 for i in days)
V = (s1 + s2) / N以上是人口差异的结果。如果将v[i]作为样本方差,则需要对s1和V做一些小的修改:
s1_sample = sum((n[i] - 1) * v[i] for i in days)
V_sample = (s1_sample + s2) / (N - 1)发布于 2011-10-13 10:58:33
不,你不能加标准差。
用你提供的数字向自己证明:
X= 2.645751311,Y= 13.72345923
组合集标准差: 11.48912529
你可以用标准差公式做一个更一般的证明。您需要两个变量的协方差-向下滚动到“身份”:
http://en.wikipedia.org/wiki/Standard_deviation
https://stackoverflow.com/questions/7753002
复制相似问题