首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >拼花和数据复制

拼花和数据复制
EN

Stack Overflow用户
提问于 2016-01-19 10:31:53
回答 1查看 1.4K关注 0票数 0

因为它的柱状格式使得OLAP查询速度更快,但在另一边,数据集是复制的(原始数据+拼板数据)。即使拼花可以压缩,你不认为复制所有数据会花费很多吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-01-21 06:34:05

这取决于您的用例。如果您出于各种原因需要数据,例如对暂存数据和查询,则可能需要重复。

尤其是OLAP查询,通常只涉及特定的列。同时,与其他文件相比,编写Parquet文件需要更多的时间。

简而言之,如果您的两个数据都是OLAP查询的目标,您可能需要考虑只使用文件的Parquet版本。

请参阅本文件以供参考。search=2

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34874434

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档