首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >PySpark: java.io.EOFException

PySpark: java.io.EOFException
EN

Stack Overflow用户
提问于 2021-04-12 23:44:04
回答 1查看 53关注 0票数 0

我们今天开始收到这个通用的-

原因: org.apache.spark.SparkException:由于阶段故障导致作业中止: java.io.EOFException

我看到一些文章讨论这是由于大文件,缺失库,或内存限制。

https://datascience.stackexchange.com/questions/40130/pyspark-java-io-eofexception

PySpark throws java.io.EOFException when reading big files with boto3

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-04-12 23:44:04

对我们来说,它最终是一个空的.seq文件,它是由我们的ETL工具之一编写的。删除该无效文件已为我们解决了问题。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67061445

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档