首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >按爆炸性对查询组进行分组

按爆炸性对查询组进行分组
EN

Stack Overflow用户
提问于 2014-05-29 20:16:04
回答 1查看 525关注 0票数 1

我正在对包含2.2亿行的128 on表运行以下查询:

代码语言:javascript
复制
select id, count(*) as cnt 
from logs.nobids_05 
group each by 1 
having cnt > 1 
limit 10;

如果出现“查询执行期间超出的资源”错误,则会失败。

这个表中的id应该是唯一的,我想检查一下是否确实如此。

有办法运行这个查询吗?

我理解,后面的算法可能会产生一个与原始表大小相似的临时哈希表。bigquery (dremel)对每个查询可以创建的临时数据量是否仍然有限制?

你对解决办法有什么建议吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-05-30 00:59:13

这个问题现在已经解决了。您应该不再看到此查询的资源超过了,而且许多其他查询都不应该再遇到此问题。如果你继续有问题,请点击线程。

背景:

当您使用GROUP时,BigQuery会猜测每个操作将涉及到组中的数据的大小(从技术上讲,它关心键的基数)。有时这是容易的,有时不是。

为此设置的配置阈值太小;也就是说,对于给定的查询,我们没有为每个按操作操作的组提供足够的资源以使其成功。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/23942157

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档