我在寻找使用amazon-redshift-spectrum按日期创建分区的最佳实践,但示例显示了仅按一个日期对表进行分区所解决的问题。如果我有多个约会字段怎么办?
使用user_install_date和event_date的移动事件
将您的s3划分为:
installdate=2015-01-01/eventdate=2017-01-01
installdate=2015-01-01/eventdate=2017-01-02
installdate=2015-01-01/eventdate=2017-01-03它会扼杀我的select性能吗?在这种情况下,最好的策略是什么?
发布于 2017-10-06 22:57:15
如果以上述方式对数据进行分区,那么仅在WHERE子句中使用eventdate (不包括installdate)的查询效率就会降低。
它仍然需要查看每个installdate目录,但是它可以跳过与谓词不匹配的eventdate目录。
将使用较少的参数放在第二位。
https://stackoverflow.com/questions/46614245
复制相似问题