我想使用EMRFS3优化的提交器。在火花电子病历中运行新步骤时,我将"spark.sql.parquet.fs.optimized.committer.optimization-enabled“设置为true。但我认为它没有使用优化的提交器(_SUCCESS是0字节)。EMR如何选择使用哪一个提交者?它能使用对数据集的优化和对RDD的未优化吗?因为我两个人都有相同的火花。
发布于 2022-03-10 10:22:25
https://stackoverflow.com/questions/71381509
复制相似问题