首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >红移中的截断均值

红移中的截断均值
EN

Stack Overflow用户
提问于 2015-09-03 21:35:11
回答 2查看 436关注 0票数 0

如何在红移数据库中计算Truncated Mean?我希望它在非常大的数据集上运行

EN

回答 2

Stack Overflow用户

发布于 2015-09-05 04:32:04

Redshift包括常用的SQL统计函数,包括您需要的NTILE

代码语言:javascript
复制
SELECT AVG(CASE WHEN quartile IN (2,3) THEN my_metric ELSE NULL END) central_mean
      ,AVG(my_metric) mean
FROM (SELECT my_metric, NTILE(4) OVER (ORDER BY cpu_usage) quartile
        FROM (SELECT * FROM my_table LIMIT 1000 ) t ) t
;
票数 0
EN

Stack Overflow用户

发布于 2017-04-06 15:49:52

您可以获取要从集合中剔除的百分位数的阈值。然后过滤掉这些阈值边界之外的度量值,最后您可以计算平均值。

代码语言:javascript
复制
SELECT avg(your_metric)
FROM (
   SELECT
     your_metric,
     PERCENTILE_DISC(0.1) -- 10% lower boundary 
     WITHIN GROUP (ORDER BY your_metric) OVER () AS lower_threshold,
     PERCENTILE_DISC(0.9) -- 90% higher boundary
     WITHIN GROUP (ORDER BY your_metric) OVER () AS higher_threshold
   FROM your_table

 ) t1 WHERE your_metric > lower_threshold AND your_metric < higher_threshold
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32377181

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档