我有一个包含大量数据(比如1,000,000,000行)的表。
表结构:
Id(Primary Key)
Name
...我省略了表中的其他字段,因为我不能使用其中的任何字段来限制我获取的数据。
这里的主键是Id。我没有任何索引,只有名称列。
我需要找到出现次数超过n次的名字列表(比如n=10)。
我已经尝试了以下选项:
SELECT /+full(T)/ Name,COUNT(Id) AS CNT FROM T GROUP BY Name HAVING COUNT(ID) >10;
select distinct Name, COUNT(ID) OVER (PARTITION BY Name) AS CNT FROM T where CNT>10;它们都占用了很大的临时空间。
优化查询以使用更少的临时空间的任何其他建议。对我来说,速度不是最主要的问题。即使查询需要大约2个小时,也是可以的。
发布于 2016-04-21 21:58:34
WITH names AS ( select Name,COUNT(ID) OVER (PARTITION BY Name) AS CNT FROM T) select DISTINCT name from names where names.CNT > 10
https://stackoverflow.com/questions/36770463
复制相似问题