我正在尝试构建一个报告系统,但遇到查询速度慢的问题,希望听到您的建议:我应该使用哪个DB (或任何其他大数据解决方案)来支持:- ETL每15分钟-每天300M行-来自web应用程序的查询应该在大约20秒内返回。
目前,我在ORC表上使用带日期分区的EMR,但即使在对1个维度运行group by查询并对度量求和时,也需要超过1分钟。
谢谢
发布于 2017-02-15 06:59:58
这里有一些来自亚马逊网络服务ReInvent的关于数据库+搜索层的精彩讨论:
https://youtu.be/K7o5OlRLtvU?t=1574
我应该使用什么数据存储?
https://stackoverflow.com/questions/42124974
相似问题