首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >BigQuery集群:具有多个键的命中聚类

BigQuery集群:具有多个键的命中聚类
EN

Stack Overflow用户
提问于 2021-11-23 12:56:00
回答 1查看 444关注 0票数 0

我们有一个按时分区的表(512 M字节/分区),它在customer_id和time上也有一个集群键。

到目前为止,我们有以下查询,这些查询运行良好:

代码语言:javascript
复制
SELECT column FROM TABLE WHERE customer_id = 'key' and time > '2021-11-10'

SELECT column FROM TABLE WHERE customer_id IN ('key1', 'key2') and time > '2021-11-10'

今天,我们将尝试以下查询:

代码语言:javascript
复制
SELECT column FROM TABLE WHERE customer_id IN (SELECT customer_id FROM customers) AND time > '2021-11-10'                            

我们看到,这个查询没有使用集群,因此从BigQuery中获取了更多的数据。然后我找到了这篇文章,解释了复杂过滤不适用于集群表达

是否有一个解决方案来定义查询之外的id列表并将其注入查询中?(因为现在我们需要将id列表生成为代码)。

提前打电话,问候

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-11-28 11:48:28

结束评论中的讨论:

使用分区和聚类来提高查询性能和控制大量数据查询的成本。分区有助于将数据分割为分区,并根据指定的列(即。聚集的列。

正如文档中提到的,为了使集群高效工作,您的表/分区应该大于或大约1GB。在您的情况下,如果您尝试对512‘t的数据进行集群,那么查询性能就不会有任何明显的差异。如果分区导致每个分区的数据量很小(大约小于1GB),那么您应该更喜欢集群而不是分区。

有关更多信息,请参阅此文档

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/70081307

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档