首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >非结构化查询的性能要好于集群、散列聚集和索引?

非结构化查询的性能要好于集群、散列聚集和索引?
EN

Stack Overflow用户
提问于 2015-09-29 04:11:14
回答 2查看 78关注 0票数 0

我使用下面的查询作为一些非结构化数据(没有索引、没有集群等)的基线,并且与我向联接列添加索引或将表添加到集群或散列时相比,该查询在非结构数据上的性能更好。我觉得我的基线查询并不理想,我的任务是获取一个基线查询,并找到一个性能最好的结构,但是我尝试过的所有结构都比非结构化结构执行得更糟糕。我能对基线查询做些什么,至少能找到一个比非结构化结构有明显改进的结构吗?

查询:

代码语言:javascript
复制
SELECT Cust_name, price
FROM Customer, Sales
WHERE price > 1000
AND num_sold > 10
AND Sales.Cust_id = Customer.Cust_id;

此查询将返回150 K中的108k+行。

下面是测试的痕迹:

非结构化的:

在联接列Sales.Cust_id和Customer.Cust_id上添加索引:

将这两个表添加到集群中,其中群集索引为Cust_id:

将这两个表添加到具有10000键的散列集群中:

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-09-29 04:35:55

您选择72%的数据。我不认为任何结构会对这种情况有很大帮助。非结构化的似乎是最好的。

票数 4
EN

Stack Overflow用户

发布于 2015-09-29 07:42:34

我唯一能想到的改善这种情况的方法是:

  1. 范围划分销售表的价格,num_sold,或两者。
  2. 使用物化视图预联接表,并/或限制所需的列和/或限制所需的行。
  3. 对sales表使用一种压缩形式(只有在使用直接路径批量插入销售时才有价值)。
  4. 也许可以在您使用的sales表的列上尝试一个压缩的索引,或者对客户使用一个索引(cust_id,cust_name),并希望快速进行完整的索引扫描。
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32835567

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档