首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >ratio_skew_across_slices [红移]的良好价值

ratio_skew_across_slices [红移]的良好价值
EN

Stack Overflow用户
提问于 2020-10-28 16:46:25
回答 1查看 142关注 0票数 0

我读过这篇文章:

https://docs.aws.amazon.com/redshift/latest/dg/c_analyzing-table-design.html

给出了一个分析表设计的查询。对于每个表,它给出了两个指标:

  • ratio_skew_across_slices
  • pct_slices_populated

在这篇文章中,我读到一个小值对ratio_skew_across_slices是有益的。一定要有多小?我发现只有这篇文章给了我一个门槛:

https://dwgeek.com/redshift-table-data-skew-avoid.html/

<4是好的。我能接受这个门槛吗?我有一些值为2.0和2.15的表。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-11-09 02:23:39

通常,表倾斜没有可接受的或定义的值。但经验法则是要把它保持在4以下。

为了理解这一点,让我们看一个例子。

您有一个150行的表,集群有3个节点。

  • 节点1- 100行
  • 节点2- 48行
  • 节点3-2行

斜率是如何计算的?

节点上最大行与节点上最小行之间的比率。

100/2 = 50. So the skew here is 50.

但是它是一张很小的桌子,即使倾斜度很高,也没有影响,但是想想一个大桌子。

50000000

  • Node 2- 30000000

  • Node 3- 40000000

Skew is 1.67

在这里,倾斜是非常小的,但影响太大,扫描您的数据。

因此,这取决于您决定一个特定的表是这个倾斜的罚款还是需要优化。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64577520

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档