我在Infobright中有一个事实表,大约有4000万行。在该表上运行查询,就像下面显示的那样,需要10分钟以上的时间。
SELECT pat_key,
COUNT(c_id)
FROM my_fact_table
GROUP BY pat_key
ORDER BY COUNT(c_id) DESC
LIMIT 50;
Duration/Fetch = 334.528 sec / 0.094 sec你知道为什么以及如何调优吗?
顺便说一句,硬件规格是AWS m1.large。因此,抛开网络延迟不谈,这仍然是一个重要的时间间隔。
发布于 2013-11-02 03:09:37
首先,你能提供专门针对pat_key和c_id的动态链接库吗?
其次,您运行的是Infobright Enterprise Edition还是Community Edition?
第三,你能拉出bh.err日志吗?为此,请打开brighthouse.ini (在您的数据目录中),设置ControlMessages=5,然后重新启动服务。然后,运行此查询。文件bh.err应该包含有关此查询执行情况的大量信息。一旦你这样做了,你可以把它粘贴在这里。
最后,只看一下查询: SELECT pat_key,COUNT(c_id) as the COUNT FROM my_fact_table GROUP BY pat_key ORDER BY 50 LIMIT 50;
bh.err会告诉你更多!另外,在这个实例上,您将自己限制为2个内核;您可能受到一些处理器的限制。我期待看到更多。
https://stackoverflow.com/questions/19697969
复制相似问题