我有一个冰山表,其中包含2个parquets文件,在s3中存储4行,我尝试了以下命令:
val tables = new HadoopTables(conf);
val table = tables.load("s3://iceberg-tests-storage/data/db/test5");
SparkActions.get(spark).rewriteDataFiles(table).option("target-file-size-bytes", "52428800").execute();但什么都没变。我做错什么了?
发布于 2022-05-24 16:16:18
几个注意事项:
默认情况下,
在您的情况下,如果您将min-input-files设置为2,只要文件是同一个分区的一部分,或者表没有分区,那么这些文件应该压缩在一起。
https://stackoverflow.com/questions/72362044
复制相似问题