首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >加/合并标准差

加/合并标准差
EN

Stack Overflow用户
提问于 2011-10-13 10:51:45
回答 2查看 4.9K关注 0票数 3

简写版:

可以添加/合并StdDevs吗?即

代码语言:javascript
复制
if StdDev(11,14,16,17)=X and StdDev(21,34,43,12)=Y  
can we calculate StdDev(11,14,16,17,21,34,43,12) from X & Y

长版本:

我正在设计一个星型模式。模式有一个fact_table (grain=transaction),它存储单个事务response_time。该模式还具有一个aggregate_table (grain=day),它每天存储response_time_sum。

在我的报告中,我需要计算给定时间维度的响应时间的标准差,比如日、周、月等。如何使用StandardDeviation而不是接触巨大的fact_table来计算fact_table?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2011-10-13 12:00:23

是的,你可以把它们结合起来。你需要知道每一天的观测数、平均值和标准差。方差比标准差更容易处理,所以我将用方差来表示其他的一切。(标准差被定义为方差的平方根。)

表示:

代码语言:javascript
复制
n[i] # observations for day i
m[i] # mean for day i
v[i] # variance for day i

您需要计算观察N的总数和总体平均M。这很简单:

代码语言:javascript
复制
days = [day1, day2, ..., day_final]
N = sum(n[i] for i in days)
M = sum(n[i] * m[i] for i in days) / N

总体方差V比较复杂,但仍然可以计算:

代码语言:javascript
复制
s1 = sum(n[i] * v[i] for i in days)
s2 = sum(n[i] * (m[i] - M)**2 for i in days)
V = (s1 + s2) / N

以上是人口差异的结果。如果将v[i]作为样本方差,则需要对s1V做一些小的修改:

代码语言:javascript
复制
s1_sample = sum((n[i] - 1) * v[i] for i in days)
V_sample = (s1_sample + s2) / (N - 1)
票数 7
EN

Stack Overflow用户

发布于 2011-10-13 10:58:33

不,你不能加标准差。

用你提供的数字向自己证明:

X= 2.645751311,Y= 13.72345923

组合集标准差: 11.48912529

你可以用标准差公式做一个更一般的证明。您需要两个变量的协方差-向下滚动到“身份”:

http://en.wikipedia.org/wiki/Standard_deviation

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/7753002

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档