我正在比较AWS Athena中CSV和Parquet文件的性能。
为了确保相同查询的两次连续运行的执行时间不会显著减少,我希望确保禁用缓存。
我们知道这个问题是否有解决方案吗?或者AThena在默认情况下甚至没有启用缓存。
发布于 2018-03-24 12:54:58
雅典娜如何配置后面的presto引擎完全不在我们的控制范围之内。我已经彻底测试了Aws Athena,从我的发现它并没有缓存数据。我发现连续执行相同的查询需要相似的时间和数据扫描。
但是对于成本效益而言,拼花绝对会给你带来更好的性能和更少的数据扫描。
https://stackoverflow.com/questions/49454423
复制相似问题