我正在使用我的星火结构流工作来执行我的ETL在AWS平台,我的驱动内存没有被清除。这项工作是阅读事件从动态和写入到S3下面是我的火花配置。还附加包含驱动程序JVM堆使用图的屏幕截图,以供参考(1表示100%)
spark.cleaner.periodicGC.interval=1min
spark.driver.extraJavaOptions=-XX:+UseG1GC
spark.cleaner.referenceTracking.blocking=false

发布于 2022-05-25 14:34:08
我们已经看到这一点,当星火用户界面在纱线有许多工作被列出。我们限制了no.of的工作(前)。在UI中显示的任务和阶段。这有助于减少驱动程序内存的使用。你可以试一试
spark.ui.retainedJobs, spark.ui.retainedStages,spark.ui.retainedTasks, spark.worker.ui.retainedExecutors,spark.worker.ui.retainedDrivers, spark.sql.ui.retainedExecutions,spark.streaming.ui.retainedBatcheshttps://stackoverflow.com/questions/71723301
复制相似问题