org.apache.hadoop.io.compress.zstd.ZStandardCompressor中的压缩级别似乎不起作用。我看到重置函数在ZStandardCompressor构造函数中被调用,即调用init(level,stream)来调用本机函数,我认为这是只设置zstd参数的位置。在我的测试中,我确保这是被调用的,但称它为不同的级别,如1、5、10.20等,并没有造成任何不同,因为输出大小是完全相同的。
Hadoop似乎不使用zstd,并且使用自己的东西来使用zstd。我确信人们在hadoop中使用不同的级别。你能帮我指出下一个步骤吗?
发布于 2020-09-07 14:14:01
考虑到人们发现这个问题没有答案,我正在添加我使用的解决方案。InternalParquetRecordWriter使用压缩器作为参数,所以我通过扩展BytesInputCompressor创建了一个压缩器,从而在这里集成了zstd库。
https://stackoverflow.com/questions/58352700
复制相似问题