首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >拼图文件压缩

拼图文件压缩
EN

Stack Overflow用户
提问于 2016-05-07 06:50:24
回答 4查看 12.9K关注 0票数 2

当在Spark中使用时,最优化的拼图文件压缩逻辑是什么?另外,在使用每种压缩类型压缩后,1 1gb拼图文件的大约大小是多少?

EN

回答 4

Stack Overflow用户

发布于 2016-11-16 03:10:30

Refer here for Size Difference between all the compress & uncompress

  1. ORC :如果你在蜂巢中创建兽人表格,你不能从黑斑马中插入,所以你必须在黑斑马
  2. Avro中插入,然后刷新table_name :据我所知,它与兽人
  3. 拼图是一样的:你可以在蜂巢中创建一个表格,然后从黑斑马

插入它。

票数 0
EN

Stack Overflow用户

发布于 2016-11-19 04:13:18

这取决于你有什么类型的数据;文本通常压缩得很好,随机时间戳或浮点值就不那么好了。

看看最新的Apache Big Data会议上的this presentation,特别是幻灯片15-16,其中显示了测试数据集上每列的压缩结果。

剩下的记者。是关于实木地板内部结构受压的理论与实践。

票数 0
EN

Stack Overflow用户

发布于 2022-01-21 05:05:55

在我的例子中,压缩似乎增加了文件的大小。因此,它实质上使文件变得更大且不可读。如果不能完全理解并在小文件上使用拼图,那么它真的很糟糕。因此,如果可以的话,我建议您切换到avaro文件格式。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37082504

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档